logo móvil
Contáctanos

Aprendizaje profundo por refuerzo para el control de señales de cruce considerando el comportamiento de los peatones

Autores: Han, Guangjie; Zheng, Qi; Liao, Lyuchao; Tang, Penghao; Li, Zhengrong; Zhu, Yintian

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Aprendizaje profundo por refuerzo para el control de señales de cruce considerando el comportamiento de los peatones


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje profundo por refuerzo
Control de señales de tráfico
Peatón
Intersección
Red de aprendizaje por refuerzo
Eficiencia del tráfico

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
Utilizar el aprendizaje profundo por refuerzo para resolver problemas de control de semáforos es un tema de investigación candente en el campo del transporte inteligente. Los investigadores han propuesto recientemente varias soluciones basadas en métodos de aprendizaje profundo por refuerzo para problemas de transporte inteligente. Sin embargo, la mayoría de las optimizaciones de control de señales consideran la maximización de la capacidad de tráfico como objetivo de optimización, ignorando las preocupaciones de los peatones en las intersecciones. Para abordar este problema, proponemos un método de control de semáforos de aprendizaje profundo que considera a los peatones. El método combina una red de aprendizaje por refuerzo y una estrategia de control de señales de tráfico con aspectos de eficiencia y seguridad vial. Al mismo tiempo, se considera el tiempo de espera de peatones y vehículos que pasan por la intersección, y se aplica y mejora el método de Codificación del Estado de Tráfico Discreto (DTSE) para definir estados y recompensas más completos. En el entrenamiento de la red neuronal, se adopta el método de operación multiproceso y se ejecutan múltiples entornos de entrenamiento simultáneamente para mejorar la eficiencia del entrenamiento del modelo. Finalmente, se realizan extensos experimentos de simulación en escenarios de intersección reales utilizando el software de simulación Simulation of Urban Mobility (SUMO). Los resultados muestran que en comparación con Dueling DQN, el tiempo de espera debido a nuestro método disminuyó un 58,76% y el número de personas en espera disminuyó un 51,54%. El método propuesto puede reducir tanto el número de personas en espera como el tiempo de espera en las intersecciones.

Otros recursos que podrían interesarte

Temas Virtualpro