Aplicación del Aprendizaje por Refuerzo Profundo en el Control de Reconfiguración del Sistema de Frenado Antideslizante de Aeronaves
Autores: Liu, Shuchang; Yang, Zhong; Zhang, Zhao; Jiang, Runqiang; Ren, Tongyang; Jiang, Yuan; Chen, Shuang; Zhang, Xiaokai
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aplicación del Aprendizaje por Refuerzo Profundo en el Control de Reconfiguración del Sistema de Frenado Antideslizante de Aeronaves
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Aeronave
Sistema de frenos antibloqueo
Fallos
Perturbaciones
Controlador de reconfiguración
Aprendizaje por refuerzo profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
El sistema de frenos antideslizantes de aeronaves (AABS) juega un papel importante en el despegue, rodaje y aterrizaje seguro de las aeronaves. Además de las perturbaciones del complejo entorno de la pista, posibles fallos en los componentes, como los fallos en los actuadores, también pueden reducir la seguridad y fiabilidad del AABS. Para satisfacer los crecientes requisitos de rendimiento del AABS en condiciones de fallos y perturbaciones, se propuso en este artículo un nuevo controlador de reconfiguración basado en el control de rechazo de perturbaciones activas lineales combinado con el aprendizaje por refuerzo profundo. El controlador propuesto trató los fallos de los componentes, las perturbaciones externas y el ruido de medición como las perturbaciones totales. Se introdujo el algoritmo de gradiente de política determinista profunda con retraso doble (TD3) para realizar los autoajustes de parámetros tanto del observador de estado extendido como de la ley de retroalimentación del error de estado. El espacio de acción, el espacio de estado, la función de recompensa y la estructura de la red para el entrenamiento del algoritmo fueron diseñados adecuadamente, de modo que las perturbaciones totales pudieran ser estimadas y compensadas con mayor precisión. Los resultados de la simulación validaron la adaptabilidad ambiental y la robustez del controlador de reconfiguración propuesto.
Descripción
El sistema de frenos antideslizantes de aeronaves (AABS) juega un papel importante en el despegue, rodaje y aterrizaje seguro de las aeronaves. Además de las perturbaciones del complejo entorno de la pista, posibles fallos en los componentes, como los fallos en los actuadores, también pueden reducir la seguridad y fiabilidad del AABS. Para satisfacer los crecientes requisitos de rendimiento del AABS en condiciones de fallos y perturbaciones, se propuso en este artículo un nuevo controlador de reconfiguración basado en el control de rechazo de perturbaciones activas lineales combinado con el aprendizaje por refuerzo profundo. El controlador propuesto trató los fallos de los componentes, las perturbaciones externas y el ruido de medición como las perturbaciones totales. Se introdujo el algoritmo de gradiente de política determinista profunda con retraso doble (TD3) para realizar los autoajustes de parámetros tanto del observador de estado extendido como de la ley de retroalimentación del error de estado. El espacio de acción, el espacio de estado, la función de recompensa y la estructura de la red para el entrenamiento del algoritmo fueron diseñados adecuadamente, de modo que las perturbaciones totales pudieran ser estimadas y compensadas con mayor precisión. Los resultados de la simulación validaron la adaptabilidad ambiental y la robustez del controlador de reconfiguración propuesto.