Soc-VRP: un mecanismo de planificación de rutas de vehículos basado en aprendizaje profundo por refuerzo para ITS cooperativo orientado al servicio
Autores: Hou, Boyuan; Zhang, Kailong; Gong, Zu; Li, Qiugang; Zhou, Junle; Zhang, Jiahao; de La Fortelle, Arnaud
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Soc-VRP: un mecanismo de planificación de rutas de vehículos basado en aprendizaje profundo por refuerzo para ITS cooperativo orientado al servicio
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Desarrollo rápido
Tecnología de la información emergente
Sistema de Transporte Inteligente
ITS Cooperativo
Problema de Enrutamiento de Vehículos
Aprendizaje Profundo por Reforzamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
Con el rápido desarrollo de la tecnología de la información emergente y su creciente integración con los sistemas de transporte, el Sistema de Transporte Inteligente (ITS) está entrando en una nueva fase, llamada ITS Cooperativo (C-ITS). Ofrece soluciones prometedoras a numerosos desafíos en los sistemas de transporte tradicionales, entre los cuales el Problema de Enrutamiento de Vehículos (VRP) es una preocupación significativa abordada en este trabajo. Considerando los diferentes niveles de urgencia de los diferentes vehículos y sus diferentes restricciones de viaje en el marco del ITS Cooperativo orientado al Servicio (SoC-ITS) estudiado en nuestra investigación previa, se analiza primero el Problema de Enrutamiento de Vehículos orientado al Servicio Cooperativo (SoC-VRP), en el cual la planificación cooperativa y los grados de urgencia de los vehículos son dos factores vitales. Después de examinar las características tanto del VRP como del SoC-VRP, se propone un mecanismo de planificación de rutas priorizadas basado en Aprendizaje Profundo por Refuerzo (DRL). Específicamente, establecemos un modelo de aprendizaje profundo por refuerzo con Rainbow DQN y diseñamos un método de planificación de rutas de toma de decisiones sucesivas priorizadas para SoC-ITS, donde los grados de urgencia de los vehículos se asignan a tres prioridades: Alta para vehículos de emergencia, Media para autobuses de enlace y Baja para el resto. Todos los modelos y métodos propuestos se implementan, se entrenan utilizando varios escenarios en redes viales típicas y se verifican con escenas basadas en SUMO. Los resultados experimentales demuestran la efectividad de este mecanismo de planificación de rutas priorizadas híbrido.
Descripción
Con el rápido desarrollo de la tecnología de la información emergente y su creciente integración con los sistemas de transporte, el Sistema de Transporte Inteligente (ITS) está entrando en una nueva fase, llamada ITS Cooperativo (C-ITS). Ofrece soluciones prometedoras a numerosos desafíos en los sistemas de transporte tradicionales, entre los cuales el Problema de Enrutamiento de Vehículos (VRP) es una preocupación significativa abordada en este trabajo. Considerando los diferentes niveles de urgencia de los diferentes vehículos y sus diferentes restricciones de viaje en el marco del ITS Cooperativo orientado al Servicio (SoC-ITS) estudiado en nuestra investigación previa, se analiza primero el Problema de Enrutamiento de Vehículos orientado al Servicio Cooperativo (SoC-VRP), en el cual la planificación cooperativa y los grados de urgencia de los vehículos son dos factores vitales. Después de examinar las características tanto del VRP como del SoC-VRP, se propone un mecanismo de planificación de rutas priorizadas basado en Aprendizaje Profundo por Refuerzo (DRL). Específicamente, establecemos un modelo de aprendizaje profundo por refuerzo con Rainbow DQN y diseñamos un método de planificación de rutas de toma de decisiones sucesivas priorizadas para SoC-ITS, donde los grados de urgencia de los vehículos se asignan a tres prioridades: Alta para vehículos de emergencia, Media para autobuses de enlace y Baja para el resto. Todos los modelos y métodos propuestos se implementan, se entrenan utilizando varios escenarios en redes viales típicas y se verifican con escenas basadas en SUMO. Los resultados experimentales demuestran la efectividad de este mecanismo de planificación de rutas priorizadas híbrido.