Programación Dinámica Adaptativa con Aprendizaje por Refuerzo en la Optimización de la Programación de Salidas de Vuelo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Programación Dinámica Adaptativa con Aprendizaje por Refuerzo en la Optimización de la Programación de Salidas de Vuelo

Autores: Liu, Hong; Li, Song; Sun, Fang; Fan, Wei; Ip, Wai-Hung; Yung, Kai-Leung

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Programación Dinámica Adaptativa con Aprendizaje por Refuerzo en la Optimización de la Programación de Salidas de Vuelo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Programación de horarios de salida del tráfico aéreo

Toma de decisiones automatizada

Modelo matemático

Marco de simulación dinámica

Estrategia de control de optimización

Programación dinámica adaptativa

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 18

Citaciones: Sin citaciones

Las complejidades de la programación de salidas del tráfico aéreo, especialmente cuando numerosos vuelos están retrasados, frecuentemente obstaculizan la implementación de la toma de decisiones automatizada para la programación. Para superar este obstáculo, se propone un modelo matemático y se diseña un marco de simulación dinámica para abordar el dilema de la programación. Una estrategia de control de optimización se basa en la programación dinámica adaptativa (ADP), centrándose en minimizar el tiempo de retraso acumulado para un grupo de aeronaves retrasadas en medio de la congestión. Esta técnica aprovecha una aproximación de la función de valor de la programación dinámica, aumentada por el aprendizaje por refuerzo para mejorar la aproximación y aliviar la complejidad computacional a medida que aumenta el número de vuelos. Se realizan análisis comparativos con enfoques alternativos, incluyendo el algoritmo de ramificación y acotación para condiciones estáticas y el algoritmo de primero en llegar, primero en ser atendido (FCFS) para escenarios rutinarios. Además, las simulaciones de perturbación de los parámetros de ADP validan la robustez y eficacia del método. ADP, cuando se integra con el aprendizaje por refuerzo, demuestra eficiencia temporal y fiabilidad, posicionándose como una solución viable para la toma de decisiones en los sistemas de gestión de salidas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro