Estrategia de Recuperación de Inversiones de Aeronaves y Sistema de Asistencia al Piloto Basado en Aprendizaje por Refuerzo
Autores: Wang, Jin; Zhao, Peng; Zhang, Zhe; Yue, Ting; Liu, Hailiang; Wang, Lixin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Estrategia de Recuperación de Inversiones de Aeronaves y Sistema de Asistencia al Piloto Basado en Aprendizaje por Refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Estado de malestar
Estrategia de recuperación ante malestar
Sistema de asistencia al piloto
Aprendizaje por refuerzo
Seguridad en vuelo
Entrenamiento de pilotos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
El estado de descontrol es un estado de vuelo inesperado, que se caracteriza por una desviación no intencionada de los parámetros operativos normales. Es difícil para el piloto recuperar la aeronave del estado de descontrol de manera precisa y rápida. En este documento, se propone una estrategia de recuperación de descontrol y un sistema de asistencia al piloto (PAS) basado en el aprendizaje por refuerzo. Se estableció un sistema de bucle cerrado hombre-máquina y se indujo el estado de descontrol, como un alto ángulo de ataque y un gran ángulo de actitud. El problema de recuperación de descontrol se transformó en un problema de decisión secuencial, y se estableció el modelo de decisión de Markov para la recuperación de descontrol tomando el cambio de deflexión de la superficie de control como acción. Se seleccionó el algoritmo de optimización de políticas proximales (PPO) para el entrenamiento de la estrategia. El modelo de piloto adaptativo y el método de aprendizaje por refuerzo propuestos en este documento se utilizaron para hacer que la aeronave se recuperara del estado de descontrol. Basado en la correspondencia entre el estado de vuelo, el método de recuperación y el resultado de recuperación, se formaron los sobres de seguridad para la recuperación de descontrol de la aeronave, y se construyó el PAS de recuperación de descontrol de cuatro niveles con modos de advertencia de alarma, control coordinado y recuperación autónoma. Los resultados de la simulación de vuelo virtual digital y la prueba de vuelo en tierra muestran que, en comparación con un piloto tradicional, la estrategia de recuperación de descontrol de la aeronave, los sobres de seguridad para la recuperación de descontrol y el PAS establecidos en este estudio podrían reducir la carga de manejo del piloto y mejorar la tasa de éxito y el efecto de la recuperación de descontrol. Esta investigación tiene ciertos valores de referencia teóricos para la seguridad de vuelo y la formación de pilotos.
Descripción
El estado de descontrol es un estado de vuelo inesperado, que se caracteriza por una desviación no intencionada de los parámetros operativos normales. Es difícil para el piloto recuperar la aeronave del estado de descontrol de manera precisa y rápida. En este documento, se propone una estrategia de recuperación de descontrol y un sistema de asistencia al piloto (PAS) basado en el aprendizaje por refuerzo. Se estableció un sistema de bucle cerrado hombre-máquina y se indujo el estado de descontrol, como un alto ángulo de ataque y un gran ángulo de actitud. El problema de recuperación de descontrol se transformó en un problema de decisión secuencial, y se estableció el modelo de decisión de Markov para la recuperación de descontrol tomando el cambio de deflexión de la superficie de control como acción. Se seleccionó el algoritmo de optimización de políticas proximales (PPO) para el entrenamiento de la estrategia. El modelo de piloto adaptativo y el método de aprendizaje por refuerzo propuestos en este documento se utilizaron para hacer que la aeronave se recuperara del estado de descontrol. Basado en la correspondencia entre el estado de vuelo, el método de recuperación y el resultado de recuperación, se formaron los sobres de seguridad para la recuperación de descontrol de la aeronave, y se construyó el PAS de recuperación de descontrol de cuatro niveles con modos de advertencia de alarma, control coordinado y recuperación autónoma. Los resultados de la simulación de vuelo virtual digital y la prueba de vuelo en tierra muestran que, en comparación con un piloto tradicional, la estrategia de recuperación de descontrol de la aeronave, los sobres de seguridad para la recuperación de descontrol y el PAS establecidos en este estudio podrían reducir la carga de manejo del piloto y mejorar la tasa de éxito y el efecto de la recuperación de descontrol. Esta investigación tiene ciertos valores de referencia teóricos para la seguridad de vuelo y la formación de pilotos.