Un método de guía de entrada hipersónica en tiempo real y óptimo utilizando aprendizaje por refuerzo inverso
Autores: Su, Linfeng; Wang, Jinbo; Chen, Hongbo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un método de guía de entrada hipersónica en tiempo real y óptimo utilizando aprendizaje por refuerzo inverso
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Vehículos hipersónicos
Algoritmos de guía
Aprendizaje por refuerzo
Red neuronal
Función de recompensa
Rendimiento en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
La misión de los vehículos hipersónicos enfrenta el problema de dinámicas altamente no lineales y entornos complejos, lo que presenta desafíos para el nivel de inteligencia y el rendimiento en tiempo real de los algoritmos de guía a bordo. En este artículo, se utiliza el aprendizaje por refuerzo inverso para abordar el problema de guía de entrada hipersónica. Los pares de muestras de estado-control y los pares de muestras de estado-recompensas obtenidos al interactuar con la dinámica de entrada hipersónica se utilizan para entrenar la red neuronal aplicando el método de optimización de políticas proximales distribuidas. Para superar el problema de recompensa escasa en el problema de entrada hipersónica, se diseña una nueva función de recompensa combinada con una sofisticada red discriminadora para generar recompensas óptimas densas de manera continua, que es la principal contribución de este artículo. La metodología de guía optimizada puede lograr una buena precisión terminal y altas tasas de éxito con un pequeño número de trayectorias como conjuntos de datos, mientras satisface las restricciones de tasa de calentamiento, sobrecarga y presión dinámica. El método de guía propuesto se emplea para dos vehículos típicos de entrada hipersónica (Vehículo Aero Común-Hipersónico y Vehículo de Lanzamiento Reutilizable) para demostrar la viabilidad y el potencial. Los resultados de simulación numérica validan el rendimiento en tiempo real y la optimalidad del método propuesto e indican su idoneidad para aplicaciones a bordo en el vuelo de entrada hipersónica.
Descripción
La misión de los vehículos hipersónicos enfrenta el problema de dinámicas altamente no lineales y entornos complejos, lo que presenta desafíos para el nivel de inteligencia y el rendimiento en tiempo real de los algoritmos de guía a bordo. En este artículo, se utiliza el aprendizaje por refuerzo inverso para abordar el problema de guía de entrada hipersónica. Los pares de muestras de estado-control y los pares de muestras de estado-recompensas obtenidos al interactuar con la dinámica de entrada hipersónica se utilizan para entrenar la red neuronal aplicando el método de optimización de políticas proximales distribuidas. Para superar el problema de recompensa escasa en el problema de entrada hipersónica, se diseña una nueva función de recompensa combinada con una sofisticada red discriminadora para generar recompensas óptimas densas de manera continua, que es la principal contribución de este artículo. La metodología de guía optimizada puede lograr una buena precisión terminal y altas tasas de éxito con un pequeño número de trayectorias como conjuntos de datos, mientras satisface las restricciones de tasa de calentamiento, sobrecarga y presión dinámica. El método de guía propuesto se emplea para dos vehículos típicos de entrada hipersónica (Vehículo Aero Común-Hipersónico y Vehículo de Lanzamiento Reutilizable) para demostrar la viabilidad y el potencial. Los resultados de simulación numérica validan el rendimiento en tiempo real y la optimalidad del método propuesto e indican su idoneidad para aplicaciones a bordo en el vuelo de entrada hipersónica.