logo móvil
Contáctanos

Aprendizaje por refuerzo de doble objetivo basado en control adaptativo de semáforos para descarbonización y optimización de eficiencia

Autores: Zhang, Gongquan; Chang, Fangrong; Huang, Helai; Zhou, Zilong

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Aprendizaje por refuerzo de doble objetivo basado en control adaptativo de semáforos para descarbonización y optimización de eficiencia


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Control de señales de tráfico adaptativo
Sistemas ATSC
Cuestiones ambientales del aire
Algoritmo ATSC optimizado
Aprendizaje profundo por refuerzo
Marco de trabajo DRL

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
Para mejorar la eficiencia del tráfico, se han desarrollado ampliamente sistemas de control de señales de tráfico adaptativas (ATSC). Sin embargo, pocos estudios han optimizado proactivamente los problemas ambientales del aire en el desarrollo de ATSC. Para llenar esta brecha de investigación, este estudio propone un algoritmo ATSC optimizado que tenga en cuenta tanto la eficiencia del tráfico como la descarbonización. El algoritmo propuesto se desarrolla en base al marco de aprendizaje por refuerzo profundo (DRL) con objetivos duales (DRL-DG) para la optimización del sistema de control de tráfico. Se diseña una estructura de red novedosa que combina Redes Neuronales Convolucionales y Redes Neuronales de Memoria a Corto y Largo Plazo para mapear el estado del tráfico en la intersección a un valor Q, acelerando el proceso de aprendizaje. El mecanismo de recompensa implica una función de optimización multiobjetivo, empleando el método de peso de entropía para equilibrar los pesos entre los objetivos duales. Basándose en una intersección representativa en Changsha, provincia de Hunan, China, se construye un escenario de intersección simulado para entrenar y probar el algoritmo propuesto. El resultado muestra que el sistema ATSC optimizado por el DRL-DG propuesto resulta en una reducción de más del 71% en el tiempo de espera de vehículos y del 46% en las emisiones de carbono en comparación con los sistemas tradicionales de control de señales de tráfico. Converge más rápido y logra una optimización de objetivos duales equilibrada en comparación con el ATSC basado en DRL predominante.

Otros recursos que podrían interesarte

Temas Virtualpro