logo móvil
Contáctanos

Toma de decisiones para vehículos autónomos en entornos inesperados utilizando métodos eficientes de aprendizaje por refuerzo

Autores: Kim, Min-Seong; Eoh, Gyuho; Park, Tae-Hyoung

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Toma de decisiones para vehículos autónomos en entornos inesperados utilizando métodos eficientes de aprendizaje por refuerzo


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje por refuerzo
Vehículos autónomos
Toma de decisiones
Incertidumbre
Redes neuronales
Modelo de mezcla gaussiana

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones


Descripción
El aprendizaje profundo por refuerzo (DRL) permite que los vehículos autónomos realicen toma de decisiones complejas utilizando redes neuronales. Sin embargo, las redes DRL anteriores solo producen decisiones, por lo que no hay forma de determinar si la decisión es adecuada. Los agentes de aprendizaje por refuerzo pueden seguir produciendo decisiones incorrectas en entornos inesperados que no se encontraron durante el proceso de aprendizaje. En particular, una decisión incorrecta puede provocar un accidente en la conducción autónoma. Por lo tanto, es necesario indicar si la acción es una decisión razonable. Como un método de este tipo, la incertidumbre puede informar si la decisión del agente es apropiada para la aplicación práctica donde la seguridad debe estar garantizada. Por lo tanto, este documento proporciona incertidumbre en la decisión al proponer DeepSet-Q con mezcla gaussiana (DwGM-Q), que converge el DeepSet-Q existente y la red de densidad de mezcla (MDN). Calcular la incertidumbre con el modelo de mezcla gaussiana (GMM) producido a partir de MDN permitió calcular más rápido que el método de conjunto existente. Además, se verificó cómo responde el agente a la situación no aprendida a través del simulador de Movilidad Urbana (SUMO) y se comparó la incertidumbre de la decisión entre la situación aprendida y no entrenada.

Otros recursos que podrían interesarte

Temas Virtualpro