logo móvil
Contáctanos

Un estudio sobre un modelo mejorado de simulación de conducción autónoma basado en aprendizaje por refuerzo utilizando un modelo de prevención de colisiones

Autores: Kim, Jong-Hoon; Huh, Jun-Ho; Jung, Se-Hoon; Sim, Chun-Bo

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Un estudio sobre un modelo mejorado de simulación de conducción autónoma basado en aprendizaje por refuerzo utilizando un modelo de prevención de colisiones


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Modelos de conducción autónoma
Aprendizaje por refuerzo
Algoritmo DQN
Rendimiento de conducción autónoma
Recompensas
Modelo de prevención de colisiones

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 32

Citaciones: Sin citaciones


Descripción
Este documento se propuso revisar y mejorar los modelos existentes de conducción autónoma utilizando el aprendizaje por refuerzo, proponiendo así un modelo de predicción de conducción autónoma reforzado. El documento llevó a cabo el entrenamiento de un modelo de aprendizaje por refuerzo utilizando DQN, un algoritmo de aprendizaje por refuerzo. El objetivo principal de este documento fue reducir el tiempo dedicado al entrenamiento y mejorar el rendimiento de la conducción autónoma. Las recompensas para los agentes de aprendizaje por refuerzo se desarrollaron para imitar el comportamiento de conducción humano tanto como fuera posible. Se otorgaron altas recompensas por una mayor distancia recorrida dentro de los carriles y una mayor velocidad. Se otorgaron recompensas negativas cuando un vehículo cruzaba a otros carriles o tenía una colisión. La evaluación del rendimiento se llevó a cabo en entornos urbanos sin peatones. Los resultados de las pruebas de rendimiento muestran que el modelo con el modelo de prevención de colisiones exhibió una mejora de rendimiento más rápida en el mismo tiempo en comparación con cuando el modelo no se aplicaba. Sin embargo, no se abordaron vulnerabilidades a factores como peatones y vehículos que se acercaban desde el lado, y se mostró la falta de estabilidad en la definición de funciones de compensación y limitaciones con respecto al uso excesivo de memoria.

Otros recursos que podrían interesarte

Temas Virtualpro