Aprendizaje por refuerzo de doble objetivo basado en control adaptativo de semáforos para descarbonización y optimización de eficiencia

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Aprendizaje por refuerzo de doble objetivo basado en control adaptativo de semáforos para descarbonización y optimización de eficiencia

Autores: Zhang, Gongquan; Chang, Fangrong; Huang, Helai; Zhou, Zilong

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Aprendizaje por refuerzo de doble objetivo basado en control adaptativo de semáforos para descarbonización y optimización de eficiencia

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Control de señales de tráfico adaptativo

Sistemas ATSC

Cuestiones ambientales del aire

Algoritmo ATSC optimizado

Aprendizaje profundo por refuerzo

Marco de trabajo DRL

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones

Para mejorar la eficiencia del tráfico, se han desarrollado ampliamente sistemas de control de señales de tráfico adaptativas (ATSC). Sin embargo, pocos estudios han optimizado proactivamente los problemas ambientales del aire en el desarrollo de ATSC. Para llenar esta brecha de investigación, este estudio propone un algoritmo ATSC optimizado que tenga en cuenta tanto la eficiencia del tráfico como la descarbonización. El algoritmo propuesto se desarrolla en base al marco de aprendizaje por refuerzo profundo (DRL) con objetivos duales (DRL-DG) para la optimización del sistema de control de tráfico. Se diseña una estructura de red novedosa que combina Redes Neuronales Convolucionales y Redes Neuronales de Memoria a Corto y Largo Plazo para mapear el estado del tráfico en la intersección a un valor Q, acelerando el proceso de aprendizaje. El mecanismo de recompensa implica una función de optimización multiobjetivo, empleando el método de peso de entropía para equilibrar los pesos entre los objetivos duales. Basándose en una intersección representativa en Changsha, provincia de Hunan, China, se construye un escenario de intersección simulado para entrenar y probar el algoritmo propuesto. El resultado muestra que el sistema ATSC optimizado por el DRL-DG propuesto resulta en una reducción de más del 71% en el tiempo de espera de vehículos y del 46% en las emisiones de carbono en comparación con los sistemas tradicionales de control de señales de tráfico. Converge más rápido y logra una optimización de objetivos duales equilibrada en comparación con el ATSC basado en DRL predominante.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro