Aprendizaje profundo por refuerzo para el control de señales de cruce considerando el comportamiento de los peatones
Autores: Han, Guangjie; Zheng, Qi; Liao, Lyuchao; Tang, Penghao; Li, Zhengrong; Zhu, Yintian
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aprendizaje profundo por refuerzo para el control de señales de cruce considerando el comportamiento de los peatones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo por refuerzo
Control de señales de tráfico
Peatón
Intersección
Red de aprendizaje por refuerzo
Eficiencia del tráfico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Utilizar el aprendizaje profundo por refuerzo para resolver problemas de control de semáforos es un tema de investigación candente en el campo del transporte inteligente. Los investigadores han propuesto recientemente varias soluciones basadas en métodos de aprendizaje profundo por refuerzo para problemas de transporte inteligente. Sin embargo, la mayoría de las optimizaciones de control de señales consideran la maximización de la capacidad de tráfico como objetivo de optimización, ignorando las preocupaciones de los peatones en las intersecciones. Para abordar este problema, proponemos un método de control de semáforos de aprendizaje profundo que considera a los peatones. El método combina una red de aprendizaje por refuerzo y una estrategia de control de señales de tráfico con aspectos de eficiencia y seguridad vial. Al mismo tiempo, se considera el tiempo de espera de peatones y vehículos que pasan por la intersección, y se aplica y mejora el método de Codificación del Estado de Tráfico Discreto (DTSE) para definir estados y recompensas más completos. En el entrenamiento de la red neuronal, se adopta el método de operación multiproceso y se ejecutan múltiples entornos de entrenamiento simultáneamente para mejorar la eficiencia del entrenamiento del modelo. Finalmente, se realizan extensos experimentos de simulación en escenarios de intersección reales utilizando el software de simulación Simulation of Urban Mobility (SUMO). Los resultados muestran que en comparación con Dueling DQN, el tiempo de espera debido a nuestro método disminuyó un 58,76% y el número de personas en espera disminuyó un 51,54%. El método propuesto puede reducir tanto el número de personas en espera como el tiempo de espera en las intersecciones.
Descripción
Utilizar el aprendizaje profundo por refuerzo para resolver problemas de control de semáforos es un tema de investigación candente en el campo del transporte inteligente. Los investigadores han propuesto recientemente varias soluciones basadas en métodos de aprendizaje profundo por refuerzo para problemas de transporte inteligente. Sin embargo, la mayoría de las optimizaciones de control de señales consideran la maximización de la capacidad de tráfico como objetivo de optimización, ignorando las preocupaciones de los peatones en las intersecciones. Para abordar este problema, proponemos un método de control de semáforos de aprendizaje profundo que considera a los peatones. El método combina una red de aprendizaje por refuerzo y una estrategia de control de señales de tráfico con aspectos de eficiencia y seguridad vial. Al mismo tiempo, se considera el tiempo de espera de peatones y vehículos que pasan por la intersección, y se aplica y mejora el método de Codificación del Estado de Tráfico Discreto (DTSE) para definir estados y recompensas más completos. En el entrenamiento de la red neuronal, se adopta el método de operación multiproceso y se ejecutan múltiples entornos de entrenamiento simultáneamente para mejorar la eficiencia del entrenamiento del modelo. Finalmente, se realizan extensos experimentos de simulación en escenarios de intersección reales utilizando el software de simulación Simulation of Urban Mobility (SUMO). Los resultados muestran que en comparación con Dueling DQN, el tiempo de espera debido a nuestro método disminuyó un 58,76% y el número de personas en espera disminuyó un 51,54%. El método propuesto puede reducir tanto el número de personas en espera como el tiempo de espera en las intersecciones.