Vn-maddpg: un algoritmo de aprendizaje por refuerzo multiagente basado en ruido variable para vehículos autónomos en intersecciones sin señales

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Vn-maddpg: un algoritmo de aprendizaje por refuerzo multiagente basado en ruido variable para vehículos autónomos en intersecciones sin señales

Autores: Zhang, Hao; Du, Yu; Zhao, Shixin; Yuan, Ying; Gao, Qiuqi

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Vn-maddpg: un algoritmo de aprendizaje por refuerzo multiagente basado en ruido variable para vehículos autónomos en intersecciones sin señales

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Vehículos autónomos

Modelo de toma de decisiones

Algoritmo Variable-Noise Multi-Agent Deep Deterministic Policy Gradient (VN-MADDPG)

Estabilidad

Módulo de muestreo de importancia

Plataforma de simulación CARLA

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 42

Citaciones: Sin citaciones

El rendimiento de toma de decisiones de los vehículos autónomos tiende a ser inestable en intersecciones sin señalización, lo que les dificulta tomar decisiones óptimas. Proponemos un modelo de toma de decisiones basado en el algoritmo Variable-Noise Multi-Agent Deep Deterministic Policy Gradient (VN-MADDPG) para abordar estos problemas. El mecanismo de ruido variable reduce el ruido dinámicamente, permitiendo que el agente utilice la política aprendida de manera más efectiva para completar tareas. Esto mejora significativamente la estabilidad del modelo de toma de decisiones al tomar decisiones óptimas. El módulo de muestreo de importancia aborda la inconsistencia entre la experiencia obsoleta en el búfer de reproducción y las características ambientales actuales. Esto mejora la eficiencia de aprendizaje del modelo y aumenta la robustez del modelo de toma de decisiones. Los resultados experimentales en la plataforma de simulación CARLA muestran que la tasa de éxito de la toma de decisiones en intersecciones sin señalización por parte de los vehículos autónomos ha aumentado significativamente, y el tiempo de paso se ha reducido. El modelo de toma de decisiones basado en el algoritmo VN-MADDPG demuestra un rendimiento estable y excelente en la toma de decisiones.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro