Logrando Resultados de Aprendizaje Robustos en Conducción Autónoma con Integración de Ruido Dinámico en Aprendizaje por Refuerzo Profundo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Logrando Resultados de Aprendizaje Robustos en Conducción Autónoma con Integración de Ruido Dinámico en Aprendizaje por Refuerzo Profundo

Autores: Shi, Haotian; Chen, Jiale; Zhang, Feijun; Liu, Mingyang; Zhou, Mengjie

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Logrando Resultados de Aprendizaje Robustos en Conducción Autónoma con Integración de Ruido Dinámico en Aprendizaje por Refuerzo Profundo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Tecnología de conducción autónoma

Algoritmos de aprendizaje por refuerzo profundo

Red DynamicNoise

Red Q profunda

Red Q profunda doble

Capacidades de exploración

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

El avance de la tecnología de conducción autónoma se está volviendo cada vez más vital en el panorama tecnológico moderno, donde promete mejoras notables en seguridad, eficiencia, gestión del tráfico y uso de energía. A pesar de estos beneficios, los algoritmos convencionales de aprendizaje por refuerzo profundo a menudo tienen dificultades para navegar de manera efectiva en entornos de conducción complejos. Para abordar este desafío, proponemos una nueva red llamada DynamicNoise, que fue diseñada para mejorar significativamente el rendimiento algorítmico al introducir ruido en la red Q profunda (DQN) y la red Q profunda doble (DDQN). Inspirándose en la arquitectura NoiseNet, DynamicNoise utiliza perturbaciones estocásticas para mejorar las capacidades de exploración de estos modelos, lo que conduce a resultados de aprendizaje más robustos. Nuestros experimentos demostraron una mejora del 57.25% en la efectividad de navegación dentro de un entorno experimental 2D. Además, al integrar ruido en la selección de acciones y en las capas completamente conectadas del modelo de actor-crítico suave (SAC) en el entorno de simulación 3D CARLA más complejo, nuestro enfoque logró una ganancia de rendimiento del 18.9%, que superó sustancialmente los métodos tradicionales. Estos resultados confirmaron que la red DynamicNoise mejoró significativamente el rendimiento de los sistemas de conducción autónoma en diversos entornos simulados, independientemente de su dimensionalidad y complejidad, al mejorar sus capacidades de exploración en lugar de solo su eficiencia.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro