Programación Dinámica Adaptativa con Aprendizaje por Refuerzo en la Optimización de la Programación de Salidas de Vuelo
Autores: Liu, Hong; Li, Song; Sun, Fang; Fan, Wei; Ip, Wai-Hung; Yung, Kai-Leung
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Programación Dinámica Adaptativa con Aprendizaje por Refuerzo en la Optimización de la Programación de Salidas de Vuelo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Programación de horarios de salida del tráfico aéreo
Toma de decisiones automatizada
Modelo matemático
Marco de simulación dinámica
Estrategia de control de optimización
Programación dinámica adaptativa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Las complejidades de la programación de salidas del tráfico aéreo, especialmente cuando numerosos vuelos están retrasados, frecuentemente obstaculizan la implementación de la toma de decisiones automatizada para la programación. Para superar este obstáculo, se propone un modelo matemático y se diseña un marco de simulación dinámica para abordar el dilema de la programación. Una estrategia de control de optimización se basa en la programación dinámica adaptativa (ADP), centrándose en minimizar el tiempo de retraso acumulado para un grupo de aeronaves retrasadas en medio de la congestión. Esta técnica aprovecha una aproximación de la función de valor de la programación dinámica, aumentada por el aprendizaje por refuerzo para mejorar la aproximación y aliviar la complejidad computacional a medida que aumenta el número de vuelos. Se realizan análisis comparativos con enfoques alternativos, incluyendo el algoritmo de ramificación y acotación para condiciones estáticas y el algoritmo de primero en llegar, primero en ser atendido (FCFS) para escenarios rutinarios. Además, las simulaciones de perturbación de los parámetros de ADP validan la robustez y eficacia del método. ADP, cuando se integra con el aprendizaje por refuerzo, demuestra eficiencia temporal y fiabilidad, posicionándose como una solución viable para la toma de decisiones en los sistemas de gestión de salidas.
Descripción
Las complejidades de la programación de salidas del tráfico aéreo, especialmente cuando numerosos vuelos están retrasados, frecuentemente obstaculizan la implementación de la toma de decisiones automatizada para la programación. Para superar este obstáculo, se propone un modelo matemático y se diseña un marco de simulación dinámica para abordar el dilema de la programación. Una estrategia de control de optimización se basa en la programación dinámica adaptativa (ADP), centrándose en minimizar el tiempo de retraso acumulado para un grupo de aeronaves retrasadas en medio de la congestión. Esta técnica aprovecha una aproximación de la función de valor de la programación dinámica, aumentada por el aprendizaje por refuerzo para mejorar la aproximación y aliviar la complejidad computacional a medida que aumenta el número de vuelos. Se realizan análisis comparativos con enfoques alternativos, incluyendo el algoritmo de ramificación y acotación para condiciones estáticas y el algoritmo de primero en llegar, primero en ser atendido (FCFS) para escenarios rutinarios. Además, las simulaciones de perturbación de los parámetros de ADP validan la robustez y eficacia del método. ADP, cuando se integra con el aprendizaje por refuerzo, demuestra eficiencia temporal y fiabilidad, posicionándose como una solución viable para la toma de decisiones en los sistemas de gestión de salidas.