Aprendizaje por refuerzo multiagente basado en imágenes para el equilibrio entre demanda y capacidad

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Aprendizaje por refuerzo multiagente basado en imágenes para el equilibrio entre demanda y capacidad

Autores: Mas-Pujol, Sergi; Salamí, Esther; Pastor, Enric

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Aprendizaje por refuerzo multiagente basado en imágenes para el equilibrio entre demanda y capacidad

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Gestión del flujo de tráfico aéreo

Sistema europeo de control del tráfico aéreo

Medidas de ATFM

Congestión

Aprendizaje por refuerzo

Desequilibrios entre demanda y capacidad

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 29

Citaciones: Sin citaciones

La gestión del flujo de tráfico aéreo (ATFM) es de crucial importancia para el Sistema de Control de Tráfico Aéreo Europeo debido a dos factores: primero, el impacto del ATFM, incluyendo las implicaciones de seguridad en las operaciones de ATC; segundo, las posibles consecuencias de las medidas de ATFM tanto en las operaciones de los aeropuertos como en las de las aerolíneas. Así, la unidad central de gestión del flujo busca continuamente mejorar la gestión del flujo de tráfico para reducir retrasos y congestión. En este trabajo, investigamos el uso de métodos de aprendizaje por refuerzo (RL) para calcular políticas que resuelvan los desequilibrios entre demanda y capacidad (también conocidos como congestión) durante la fase pre-táctica. Para abordar los casos en los que las demandas esperadas superan la capacidad del sector aéreo, consideramos agentes que representan vuelos que deben decidir conjuntamente sobre retrasos en tierra. Para superar problemas de escalabilidad, proponemos utilizar imágenes de píxeles en bruto como entrada, que pueden representar un número arbitrario de agentes sin cambiar la arquitectura del sistema. Este artículo compara algoritmos de aprendizaje profundo Q-learning y de gradiente de política determinista profundo con diferentes configuraciones. Los resultados experimentales, utilizando datos del mundo real para el entrenamiento y la validación, confirman la efectividad de nuestro enfoque para resolver problemas de equilibrio entre demanda y capacidad, mostrando la robustez del enfoque de RL presentado en este artículo.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro