Un estudio sobre un modelo mejorado de simulación de conducción autónoma basado en aprendizaje por refuerzo utilizando un modelo de prevención de colisiones
Autores: Kim, Jong-Hoon; Huh, Jun-Ho; Jung, Se-Hoon; Sim, Chun-Bo
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un estudio sobre un modelo mejorado de simulación de conducción autónoma basado en aprendizaje por refuerzo utilizando un modelo de prevención de colisiones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Modelos de conducción autónoma
Aprendizaje por refuerzo
Algoritmo DQN
Rendimiento de conducción autónoma
Recompensas
Modelo de prevención de colisiones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Este documento se propuso revisar y mejorar los modelos existentes de conducción autónoma utilizando el aprendizaje por refuerzo, proponiendo así un modelo de predicción de conducción autónoma reforzado. El documento llevó a cabo el entrenamiento de un modelo de aprendizaje por refuerzo utilizando DQN, un algoritmo de aprendizaje por refuerzo. El objetivo principal de este documento fue reducir el tiempo dedicado al entrenamiento y mejorar el rendimiento de la conducción autónoma. Las recompensas para los agentes de aprendizaje por refuerzo se desarrollaron para imitar el comportamiento de conducción humano tanto como fuera posible. Se otorgaron altas recompensas por una mayor distancia recorrida dentro de los carriles y una mayor velocidad. Se otorgaron recompensas negativas cuando un vehículo cruzaba a otros carriles o tenía una colisión. La evaluación del rendimiento se llevó a cabo en entornos urbanos sin peatones. Los resultados de las pruebas de rendimiento muestran que el modelo con el modelo de prevención de colisiones exhibió una mejora de rendimiento más rápida en el mismo tiempo en comparación con cuando el modelo no se aplicaba. Sin embargo, no se abordaron vulnerabilidades a factores como peatones y vehículos que se acercaban desde el lado, y se mostró la falta de estabilidad en la definición de funciones de compensación y limitaciones con respecto al uso excesivo de memoria.
Descripción
Este documento se propuso revisar y mejorar los modelos existentes de conducción autónoma utilizando el aprendizaje por refuerzo, proponiendo así un modelo de predicción de conducción autónoma reforzado. El documento llevó a cabo el entrenamiento de un modelo de aprendizaje por refuerzo utilizando DQN, un algoritmo de aprendizaje por refuerzo. El objetivo principal de este documento fue reducir el tiempo dedicado al entrenamiento y mejorar el rendimiento de la conducción autónoma. Las recompensas para los agentes de aprendizaje por refuerzo se desarrollaron para imitar el comportamiento de conducción humano tanto como fuera posible. Se otorgaron altas recompensas por una mayor distancia recorrida dentro de los carriles y una mayor velocidad. Se otorgaron recompensas negativas cuando un vehículo cruzaba a otros carriles o tenía una colisión. La evaluación del rendimiento se llevó a cabo en entornos urbanos sin peatones. Los resultados de las pruebas de rendimiento muestran que el modelo con el modelo de prevención de colisiones exhibió una mejora de rendimiento más rápida en el mismo tiempo en comparación con cuando el modelo no se aplicaba. Sin embargo, no se abordaron vulnerabilidades a factores como peatones y vehículos que se acercaban desde el lado, y se mostró la falta de estabilidad en la definición de funciones de compensación y limitaciones con respecto al uso excesivo de memoria.