Programación de Chequeos de Mantenimiento de Aeronaves Usando Aprendizaje por Refuerzo
Autores: Andrade, Pedro; Silva, Catarina; Ribeiro, Bernardete; Santos, Bruno F.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Programación de Chequeos de Mantenimiento de Aeronaves Usando Aprendizaje por Refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Aprendizaje por refuerzo
Programación de mantenimiento
Flota de aeronaves
Algoritmo de aprendizaje profundo Q
Plan de mantenimiento
Disponibilidad de la flota
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Este documento presenta un enfoque de Aprendizaje por Refuerzo (RL) para optimizar la programación a largo plazo del mantenimiento de una flota de aeronaves. El problema considera el estado de la flota, la capacidad de mantenimiento y otras restricciones de mantenimiento para programar las revisiones en el hangar para un horizonte de tiempo específico. Las revisiones se programan dentro de un intervalo, y el objetivo es programarlas lo más cerca posible de su fecha de vencimiento. Al hacerlo, se reduce el número de revisiones y aumenta la disponibilidad de la flota. Se utiliza un algoritmo de Deep Q-learning para optimizar la política de programación. El modelo se valida en un escenario real utilizando datos de mantenimiento de 45 aeronaves. El plan de mantenimiento que se genera con nuestro enfoque se compara con un estudio previo, que presentó un enfoque basado en Programación Dinámica (DP) y estimaciones de aerolíneas para el mismo período. Los resultados muestran una reducción en el número de revisiones programadas, lo que indica el potencial del RL para resolver este problema. La adaptabilidad del RL también se prueba introduciendo pequeñas perturbaciones en las condiciones iniciales. Después de entrenar el modelo con estos escenarios simulados, los resultados muestran la robustez del enfoque de RL y su capacidad para generar planes de mantenimiento eficientes en solo unos pocos segundos.
Descripción
Este documento presenta un enfoque de Aprendizaje por Refuerzo (RL) para optimizar la programación a largo plazo del mantenimiento de una flota de aeronaves. El problema considera el estado de la flota, la capacidad de mantenimiento y otras restricciones de mantenimiento para programar las revisiones en el hangar para un horizonte de tiempo específico. Las revisiones se programan dentro de un intervalo, y el objetivo es programarlas lo más cerca posible de su fecha de vencimiento. Al hacerlo, se reduce el número de revisiones y aumenta la disponibilidad de la flota. Se utiliza un algoritmo de Deep Q-learning para optimizar la política de programación. El modelo se valida en un escenario real utilizando datos de mantenimiento de 45 aeronaves. El plan de mantenimiento que se genera con nuestro enfoque se compara con un estudio previo, que presentó un enfoque basado en Programación Dinámica (DP) y estimaciones de aerolíneas para el mismo período. Los resultados muestran una reducción en el número de revisiones programadas, lo que indica el potencial del RL para resolver este problema. La adaptabilidad del RL también se prueba introduciendo pequeñas perturbaciones en las condiciones iniciales. Después de entrenar el modelo con estos escenarios simulados, los resultados muestran la robustez del enfoque de RL y su capacidad para generar planes de mantenimiento eficientes en solo unos pocos segundos.