Aprendizaje profundo por refuerzo para el control de señales de cruce considerando el comportamiento de los peatones

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Aprendizaje profundo por refuerzo para el control de señales de cruce considerando el comportamiento de los peatones

Autores: Han, Guangjie; Zheng, Qi; Liao, Lyuchao; Tang, Penghao; Li, Zhengrong; Zhu, Yintian

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Aprendizaje profundo por refuerzo para el control de señales de cruce considerando el comportamiento de los peatones

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje profundo por refuerzo

Control de señales de tráfico

Peatón

Intersección

Red de aprendizaje por refuerzo

Eficiencia del tráfico

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones

Utilizar el aprendizaje profundo por refuerzo para resolver problemas de control de semáforos es un tema de investigación candente en el campo del transporte inteligente. Los investigadores han propuesto recientemente varias soluciones basadas en métodos de aprendizaje profundo por refuerzo para problemas de transporte inteligente. Sin embargo, la mayoría de las optimizaciones de control de señales consideran la maximización de la capacidad de tráfico como objetivo de optimización, ignorando las preocupaciones de los peatones en las intersecciones. Para abordar este problema, proponemos un método de control de semáforos de aprendizaje profundo que considera a los peatones. El método combina una red de aprendizaje por refuerzo y una estrategia de control de señales de tráfico con aspectos de eficiencia y seguridad vial. Al mismo tiempo, se considera el tiempo de espera de peatones y vehículos que pasan por la intersección, y se aplica y mejora el método de Codificación del Estado de Tráfico Discreto (DTSE) para definir estados y recompensas más completos. En el entrenamiento de la red neuronal, se adopta el método de operación multiproceso y se ejecutan múltiples entornos de entrenamiento simultáneamente para mejorar la eficiencia del entrenamiento del modelo. Finalmente, se realizan extensos experimentos de simulación en escenarios de intersección reales utilizando el software de simulación Simulation of Urban Mobility (SUMO). Los resultados muestran que en comparación con Dueling DQN, el tiempo de espera debido a nuestro método disminuyó un 58,76% y el número de personas en espera disminuyó un 51,54%. El método propuesto puede reducir tanto el número de personas en espera como el tiempo de espera en las intersecciones.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro