Enfoque basado en el aprendizaje por refuerzo para reducir el error de velocidad en el seguimiento de vehículos para vehículos autónomos conectados
Autores: Tayab, Abu; Li, Yanwen; Syed, Ahmad
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Enfoque basado en el aprendizaje por refuerzo para reducir el error de velocidad en el seguimiento de vehículos para vehículos autónomos conectados
Categoría
Tecnología de Equipos y Accesorios
Subcategoría
Diseño de equipos y herramientas
Palabras clave
Estrategia adaptativa de seguimiento de vehículos
Vehículos autónomos conectados
Aprendizaje por refuerzo
Estimador de perturbaciones
Entornos de tráfico dinámicos
Controlador robusto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Este documento sugiere una estrategia de seguimiento de vehículos adaptativa para vehículos conectados autónomos (ACVs) que integra un controlador robusto con un estimador de perturbaciones extendido (EDE) y aprendizaje por refuerzo (RL) para mejorar el rendimiento en entornos de tráfico dinámicos. Los métodos tradicionales de seguimiento de vehículos tienen dificultades para manejar perturbaciones externas e incertidumbres en la dinámica del vehículo. El método sugerido aborda esto ajustando dinámicamente la ganancia del EDE utilizando RL, lo que permite al sistema optimizar su estrategia de control en tiempo real de manera continua. Se realizaron simulaciones en dos escenarios, un vehículo siguiendo y dos vehículos siguiendo, cada uno rastreando un vehículo líder. Los resultados mostraron mejoras significativas en el seguimiento de la velocidad, con el método de control basado en RL reduciendo el error de velocidad en más del 50% en comparación con los enfoques convencionales. La técnica también condujo a un control de aceleración más suave, mejorando la estabilidad y la comodidad de conducción. Métricas cuantitativas, como la recompensa total, el error de velocidad y la magnitud de la aceleración, indican que la estrategia basada en EDE-RL sugerida proporciona una solución robusta y adaptable para el control de vehículos autónomos. Estos hallazgos indican que el RL, combinado con el control robusto, puede mejorar el rendimiento y la seguridad de los sistemas ACV, haciéndolo adecuado para aplicaciones más amplias en el agrupamiento de vehículos autónomos y escenarios de tráfico complejos, incluida la comunicación vehículo a vehículo (V2V).
Descripción
Este documento sugiere una estrategia de seguimiento de vehículos adaptativa para vehículos conectados autónomos (ACVs) que integra un controlador robusto con un estimador de perturbaciones extendido (EDE) y aprendizaje por refuerzo (RL) para mejorar el rendimiento en entornos de tráfico dinámicos. Los métodos tradicionales de seguimiento de vehículos tienen dificultades para manejar perturbaciones externas e incertidumbres en la dinámica del vehículo. El método sugerido aborda esto ajustando dinámicamente la ganancia del EDE utilizando RL, lo que permite al sistema optimizar su estrategia de control en tiempo real de manera continua. Se realizaron simulaciones en dos escenarios, un vehículo siguiendo y dos vehículos siguiendo, cada uno rastreando un vehículo líder. Los resultados mostraron mejoras significativas en el seguimiento de la velocidad, con el método de control basado en RL reduciendo el error de velocidad en más del 50% en comparación con los enfoques convencionales. La técnica también condujo a un control de aceleración más suave, mejorando la estabilidad y la comodidad de conducción. Métricas cuantitativas, como la recompensa total, el error de velocidad y la magnitud de la aceleración, indican que la estrategia basada en EDE-RL sugerida proporciona una solución robusta y adaptable para el control de vehículos autónomos. Estos hallazgos indican que el RL, combinado con el control robusto, puede mejorar el rendimiento y la seguridad de los sistemas ACV, haciéndolo adecuado para aplicaciones más amplias en el agrupamiento de vehículos autónomos y escenarios de tráfico complejos, incluida la comunicación vehículo a vehículo (V2V).