Toma de decisiones para vehículos autónomos en entornos inesperados utilizando métodos eficientes de aprendizaje por refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Toma de decisiones para vehículos autónomos en entornos inesperados utilizando métodos eficientes de aprendizaje por refuerzo

Autores: Kim, Min-Seong; Eoh, Gyuho; Park, Tae-Hyoung

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Toma de decisiones para vehículos autónomos en entornos inesperados utilizando métodos eficientes de aprendizaje por refuerzo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje por refuerzo

Vehículos autónomos

Toma de decisiones

Incertidumbre

Redes neuronales

Modelo de mezcla gaussiana

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones

El aprendizaje profundo por refuerzo (DRL) permite que los vehículos autónomos realicen toma de decisiones complejas utilizando redes neuronales. Sin embargo, las redes DRL anteriores solo producen decisiones, por lo que no hay forma de determinar si la decisión es adecuada. Los agentes de aprendizaje por refuerzo pueden seguir produciendo decisiones incorrectas en entornos inesperados que no se encontraron durante el proceso de aprendizaje. En particular, una decisión incorrecta puede provocar un accidente en la conducción autónoma. Por lo tanto, es necesario indicar si la acción es una decisión razonable. Como un método de este tipo, la incertidumbre puede informar si la decisión del agente es apropiada para la aplicación práctica donde la seguridad debe estar garantizada. Por lo tanto, este documento proporciona incertidumbre en la decisión al proponer DeepSet-Q con mezcla gaussiana (DwGM-Q), que converge el DeepSet-Q existente y la red de densidad de mezcla (MDN). Calcular la incertidumbre con el modelo de mezcla gaussiana (GMM) producido a partir de MDN permitió calcular más rápido que el método de conjunto existente. Además, se verificó cómo responde el agente a la situación no aprendida a través del simulador de Movilidad Urbana (SUMO) y se comparó la incertidumbre de la decisión entre la situación aprendida y no entrenada.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro