Logrando Resultados de Aprendizaje Robustos en Conducción Autónoma con Integración de Ruido Dinámico en Aprendizaje por Refuerzo Profundo
Autores: Shi, Haotian; Chen, Jiale; Zhang, Feijun; Liu, Mingyang; Zhou, Mengjie
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Logrando Resultados de Aprendizaje Robustos en Conducción Autónoma con Integración de Ruido Dinámico en Aprendizaje por Refuerzo Profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Tecnología de conducción autónoma
Algoritmos de aprendizaje por refuerzo profundo
Red DynamicNoise
Red Q profunda
Red Q profunda doble
Capacidades de exploración
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El avance de la tecnología de conducción autónoma se está volviendo cada vez más vital en el panorama tecnológico moderno, donde promete mejoras notables en seguridad, eficiencia, gestión del tráfico y uso de energía. A pesar de estos beneficios, los algoritmos convencionales de aprendizaje por refuerzo profundo a menudo tienen dificultades para navegar de manera efectiva en entornos de conducción complejos. Para abordar este desafío, proponemos una nueva red llamada DynamicNoise, que fue diseñada para mejorar significativamente el rendimiento algorítmico al introducir ruido en la red Q profunda (DQN) y la red Q profunda doble (DDQN). Inspirándose en la arquitectura NoiseNet, DynamicNoise utiliza perturbaciones estocásticas para mejorar las capacidades de exploración de estos modelos, lo que conduce a resultados de aprendizaje más robustos. Nuestros experimentos demostraron una mejora del 57.25% en la efectividad de navegación dentro de un entorno experimental 2D. Además, al integrar ruido en la selección de acciones y en las capas completamente conectadas del modelo de actor-crítico suave (SAC) en el entorno de simulación 3D CARLA más complejo, nuestro enfoque logró una ganancia de rendimiento del 18.9%, que superó sustancialmente los métodos tradicionales. Estos resultados confirmaron que la red DynamicNoise mejoró significativamente el rendimiento de los sistemas de conducción autónoma en diversos entornos simulados, independientemente de su dimensionalidad y complejidad, al mejorar sus capacidades de exploración en lugar de solo su eficiencia.
Descripción
El avance de la tecnología de conducción autónoma se está volviendo cada vez más vital en el panorama tecnológico moderno, donde promete mejoras notables en seguridad, eficiencia, gestión del tráfico y uso de energía. A pesar de estos beneficios, los algoritmos convencionales de aprendizaje por refuerzo profundo a menudo tienen dificultades para navegar de manera efectiva en entornos de conducción complejos. Para abordar este desafío, proponemos una nueva red llamada DynamicNoise, que fue diseñada para mejorar significativamente el rendimiento algorítmico al introducir ruido en la red Q profunda (DQN) y la red Q profunda doble (DDQN). Inspirándose en la arquitectura NoiseNet, DynamicNoise utiliza perturbaciones estocásticas para mejorar las capacidades de exploración de estos modelos, lo que conduce a resultados de aprendizaje más robustos. Nuestros experimentos demostraron una mejora del 57.25% en la efectividad de navegación dentro de un entorno experimental 2D. Además, al integrar ruido en la selección de acciones y en las capas completamente conectadas del modelo de actor-crítico suave (SAC) en el entorno de simulación 3D CARLA más complejo, nuestro enfoque logró una ganancia de rendimiento del 18.9%, que superó sustancialmente los métodos tradicionales. Estos resultados confirmaron que la red DynamicNoise mejoró significativamente el rendimiento de los sistemas de conducción autónoma en diversos entornos simulados, independientemente de su dimensionalidad y complejidad, al mejorar sus capacidades de exploración en lugar de solo su eficiencia.