Toma de decisiones para vehículos autónomos en entornos inesperados utilizando métodos eficientes de aprendizaje por refuerzo
Autores: Kim, Min-Seong; Eoh, Gyuho; Park, Tae-Hyoung
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Toma de decisiones para vehículos autónomos en entornos inesperados utilizando métodos eficientes de aprendizaje por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje por refuerzo
Vehículos autónomos
Toma de decisiones
Incertidumbre
Redes neuronales
Modelo de mezcla gaussiana
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
El aprendizaje profundo por refuerzo (DRL) permite que los vehículos autónomos realicen toma de decisiones complejas utilizando redes neuronales. Sin embargo, las redes DRL anteriores solo producen decisiones, por lo que no hay forma de determinar si la decisión es adecuada. Los agentes de aprendizaje por refuerzo pueden seguir produciendo decisiones incorrectas en entornos inesperados que no se encontraron durante el proceso de aprendizaje. En particular, una decisión incorrecta puede provocar un accidente en la conducción autónoma. Por lo tanto, es necesario indicar si la acción es una decisión razonable. Como un método de este tipo, la incertidumbre puede informar si la decisión del agente es apropiada para la aplicación práctica donde la seguridad debe estar garantizada. Por lo tanto, este documento proporciona incertidumbre en la decisión al proponer DeepSet-Q con mezcla gaussiana (DwGM-Q), que converge el DeepSet-Q existente y la red de densidad de mezcla (MDN). Calcular la incertidumbre con el modelo de mezcla gaussiana (GMM) producido a partir de MDN permitió calcular más rápido que el método de conjunto existente. Además, se verificó cómo responde el agente a la situación no aprendida a través del simulador de Movilidad Urbana (SUMO) y se comparó la incertidumbre de la decisión entre la situación aprendida y no entrenada.
Descripción
El aprendizaje profundo por refuerzo (DRL) permite que los vehículos autónomos realicen toma de decisiones complejas utilizando redes neuronales. Sin embargo, las redes DRL anteriores solo producen decisiones, por lo que no hay forma de determinar si la decisión es adecuada. Los agentes de aprendizaje por refuerzo pueden seguir produciendo decisiones incorrectas en entornos inesperados que no se encontraron durante el proceso de aprendizaje. En particular, una decisión incorrecta puede provocar un accidente en la conducción autónoma. Por lo tanto, es necesario indicar si la acción es una decisión razonable. Como un método de este tipo, la incertidumbre puede informar si la decisión del agente es apropiada para la aplicación práctica donde la seguridad debe estar garantizada. Por lo tanto, este documento proporciona incertidumbre en la decisión al proponer DeepSet-Q con mezcla gaussiana (DwGM-Q), que converge el DeepSet-Q existente y la red de densidad de mezcla (MDN). Calcular la incertidumbre con el modelo de mezcla gaussiana (GMM) producido a partir de MDN permitió calcular más rápido que el método de conjunto existente. Además, se verificó cómo responde el agente a la situación no aprendida a través del simulador de Movilidad Urbana (SUMO) y se comparó la incertidumbre de la decisión entre la situación aprendida y no entrenada.