Política de Toma de Decisiones para Vehículos Autónomos en Autopistas Usando el Método de Aprendizaje por Refuerzo Profundo (DRL)
Autores: Rizehvandi, Ali; Azadi, Shahram; Eichberger, Arno
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Política de Toma de Decisiones para Vehículos Autónomos en Autopistas Usando el Método de Aprendizaje por Refuerzo Profundo (DRL)
Categoría
Procesos industriales
Subcategoría
Automatización industrial
Palabras clave
Conducción automatizada
Aprendizaje por refuerzo profundo
Vehículos autónomos
Escenarios de adelantamiento en autopistas
Marco de control jerárquico
Gradiente de política determinista profunda
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La conducción automatizada (AD) es una nueva tecnología que tiene como objetivo mitigar los accidentes de tráfico y mejorar la eficiencia en la conducción. Este estudio presenta un método de aprendizaje por refuerzo profundo (DRL) para vehículos autónomos que puede manejar de manera segura y eficiente los escenarios de adelantamiento en la carretera. El primer paso es crear un entorno de tráfico en la carretera donde el agente pueda ser guiado de manera segura a través de los vehículos circundantes. Luego, se proporciona un marco de control jerárquico para gestionar decisiones de conducción de alto nivel y comandos de control de bajo nivel, como la velocidad y la aceleración. A continuación, se utiliza un método especial basado en DRL llamado gradiente de política determinista profunda (DDPG) para derivar estrategias de decisión para su uso en la carretera. El rendimiento del algoritmo DDPG se compara con el de los algoritmos DQN y PPO, y se evalúan los resultados. Los resultados de la simulación muestran que el algoritmo DDPG puede manejar de manera efectiva y segura las tareas de tráfico en la carretera.
Descripción
La conducción automatizada (AD) es una nueva tecnología que tiene como objetivo mitigar los accidentes de tráfico y mejorar la eficiencia en la conducción. Este estudio presenta un método de aprendizaje por refuerzo profundo (DRL) para vehículos autónomos que puede manejar de manera segura y eficiente los escenarios de adelantamiento en la carretera. El primer paso es crear un entorno de tráfico en la carretera donde el agente pueda ser guiado de manera segura a través de los vehículos circundantes. Luego, se proporciona un marco de control jerárquico para gestionar decisiones de conducción de alto nivel y comandos de control de bajo nivel, como la velocidad y la aceleración. A continuación, se utiliza un método especial basado en DRL llamado gradiente de política determinista profunda (DDPG) para derivar estrategias de decisión para su uso en la carretera. El rendimiento del algoritmo DDPG se compara con el de los algoritmos DQN y PPO, y se evalúan los resultados. Los resultados de la simulación muestran que el algoritmo DDPG puede manejar de manera efectiva y segura las tareas de tráfico en la carretera.