Inteligente control de tráfico basado en lógica difusa de tipo 2 y aprendizaje por refuerzo
Autores: Bi, Yunrui; Ding, Qinglin; Du, Yijun; Liu, Di; Ren, Shuaihang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Inteligente control de tráfico basado en lógica difusa de tipo 2 y aprendizaje por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Control inteligente del tráfico
Controlador difuso de Tipo-2
Flujo de tráfico en tiempo real
Retraso de vehículos
Aprendizaje profundo por refuerzo
Optimización de señales de tráfico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
El control inteligente de decisiones de tráfico ha sido durante mucho tiempo un problema crucial para mejorar la eficiencia y la seguridad del sistema de transporte inteligente. Las deficiencias del sistema de control de tráfico difuso de Tipo-1 en el manejo de la incertidumbre han llevado a una capacidad reducida para abordar la congestión del tráfico. Por lo tanto, este documento propone un controlador difuso de Tipo-2 para una sola intersección. Basado en información en tiempo real del flujo de tráfico, el tiempo verde de cada fase se determina dinámicamente para lograr el mínimo retraso promedio de los vehículos. Además, en el control de semáforos, varios factores (como el retraso de los vehículos y la longitud de la cola) deben equilibrarse para definir la recompensa apropiada. Un diseño de recompensa inadecuado puede fallar al guiar al algoritmo de red neuronal profunda Q-Network a aprender la estrategia óptima. Para abordar estos problemas, este documento propone una estrategia de control de tráfico de aprendizaje profundo combinada con control difuso de Tipo-2. La acción de salida del sistema de control difuso de Tipo-2 reemplaza la acción de seleccionar el valor Q de salida máximo de la red objetivo en el algoritmo DQN, reduciendo el error causado por el uso de la operación máxima de la red objetivo. Este enfoque mejora la tasa de aprendizaje en línea del agente y aumenta el valor de recompensa de la acción de control de señal. Los resultados de la simulación utilizando la plataforma Simulation of Urban MObility muestran que la optimización del control de señales de tráfico propuesta en este documento ha logrado una mejora significativa en la optimización del flujo de tráfico y la mitigación de la congestión, lo que puede mejorar efectivamente la eficiencia del tráfico frente al semáforo y mejorar el nivel general de operación del flujo de tráfico.
Descripción
El control inteligente de decisiones de tráfico ha sido durante mucho tiempo un problema crucial para mejorar la eficiencia y la seguridad del sistema de transporte inteligente. Las deficiencias del sistema de control de tráfico difuso de Tipo-1 en el manejo de la incertidumbre han llevado a una capacidad reducida para abordar la congestión del tráfico. Por lo tanto, este documento propone un controlador difuso de Tipo-2 para una sola intersección. Basado en información en tiempo real del flujo de tráfico, el tiempo verde de cada fase se determina dinámicamente para lograr el mínimo retraso promedio de los vehículos. Además, en el control de semáforos, varios factores (como el retraso de los vehículos y la longitud de la cola) deben equilibrarse para definir la recompensa apropiada. Un diseño de recompensa inadecuado puede fallar al guiar al algoritmo de red neuronal profunda Q-Network a aprender la estrategia óptima. Para abordar estos problemas, este documento propone una estrategia de control de tráfico de aprendizaje profundo combinada con control difuso de Tipo-2. La acción de salida del sistema de control difuso de Tipo-2 reemplaza la acción de seleccionar el valor Q de salida máximo de la red objetivo en el algoritmo DQN, reduciendo el error causado por el uso de la operación máxima de la red objetivo. Este enfoque mejora la tasa de aprendizaje en línea del agente y aumenta el valor de recompensa de la acción de control de señal. Los resultados de la simulación utilizando la plataforma Simulation of Urban MObility muestran que la optimización del control de señales de tráfico propuesta en este documento ha logrado una mejora significativa en la optimización del flujo de tráfico y la mitigación de la congestión, lo que puede mejorar efectivamente la eficiencia del tráfico frente al semáforo y mejorar el nivel general de operación del flujo de tráfico.