logo móvil
Contáctanos

Aprendizaje por refuerzo multiagente basado en imágenes para el equilibrio entre demanda y capacidad

Autores: Mas-Pujol, Sergi; Salamí, Esther; Pastor, Enric

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Aprendizaje por refuerzo multiagente basado en imágenes para el equilibrio entre demanda y capacidad


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Gestión del flujo de tráfico aéreo
Sistema europeo de control del tráfico aéreo
Medidas de ATFM
Congestión
Aprendizaje por refuerzo
Desequilibrios entre demanda y capacidad

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones


Descripción
La gestión del flujo de tráfico aéreo (ATFM) es de crucial importancia para el Sistema de Control de Tráfico Aéreo Europeo debido a dos factores: primero, el impacto del ATFM, incluyendo las implicaciones de seguridad en las operaciones de ATC; segundo, las posibles consecuencias de las medidas de ATFM tanto en las operaciones de los aeropuertos como en las de las aerolíneas. Así, la unidad central de gestión del flujo busca continuamente mejorar la gestión del flujo de tráfico para reducir retrasos y congestión. En este trabajo, investigamos el uso de métodos de aprendizaje por refuerzo (RL) para calcular políticas que resuelvan los desequilibrios entre demanda y capacidad (también conocidos como congestión) durante la fase pre-táctica. Para abordar los casos en los que las demandas esperadas superan la capacidad del sector aéreo, consideramos agentes que representan vuelos que deben decidir conjuntamente sobre retrasos en tierra. Para superar problemas de escalabilidad, proponemos utilizar imágenes de píxeles en bruto como entrada, que pueden representar un número arbitrario de agentes sin cambiar la arquitectura del sistema. Este artículo compara algoritmos de aprendizaje profundo Q-learning y de gradiente de política determinista profundo con diferentes configuraciones. Los resultados experimentales, utilizando datos del mundo real para el entrenamiento y la validación, confirman la efectividad de nuestro enfoque para resolver problemas de equilibrio entre demanda y capacidad, mostrando la robustez del enfoque de RL presentado en este artículo.

Otros recursos que podrían interesarte

Temas Virtualpro