logo móvil
Contáctanos

Programación Dinámica Adaptativa con Aprendizaje por Refuerzo en la Optimización de la Programación de Salidas de Vuelo

Autores: Liu, Hong; Li, Song; Sun, Fang; Fan, Wei; Ip, Wai-Hung; Yung, Kai-Leung

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Programación Dinámica Adaptativa con Aprendizaje por Refuerzo en la Optimización de la Programación de Salidas de Vuelo


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Programación de horarios de salida del tráfico aéreo
Toma de decisiones automatizada
Modelo matemático
Marco de simulación dinámica
Estrategia de control de optimización
Programación dinámica adaptativa

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 18

Citaciones: Sin citaciones


Descripción
Las complejidades de la programación de salidas del tráfico aéreo, especialmente cuando numerosos vuelos están retrasados, frecuentemente obstaculizan la implementación de la toma de decisiones automatizada para la programación. Para superar este obstáculo, se propone un modelo matemático y se diseña un marco de simulación dinámica para abordar el dilema de la programación. Una estrategia de control de optimización se basa en la programación dinámica adaptativa (ADP), centrándose en minimizar el tiempo de retraso acumulado para un grupo de aeronaves retrasadas en medio de la congestión. Esta técnica aprovecha una aproximación de la función de valor de la programación dinámica, aumentada por el aprendizaje por refuerzo para mejorar la aproximación y aliviar la complejidad computacional a medida que aumenta el número de vuelos. Se realizan análisis comparativos con enfoques alternativos, incluyendo el algoritmo de ramificación y acotación para condiciones estáticas y el algoritmo de primero en llegar, primero en ser atendido (FCFS) para escenarios rutinarios. Además, las simulaciones de perturbación de los parámetros de ADP validan la robustez y eficacia del método. ADP, cuando se integra con el aprendizaje por refuerzo, demuestra eficiencia temporal y fiabilidad, posicionándose como una solución viable para la toma de decisiones en los sistemas de gestión de salidas.

Otros recursos que podrían interesarte

Temas Virtualpro