Diseño de guía y control integrado para la intercepción tridimensional basado en aprendizaje por refuerzo profundo
Autores: Wang, Wenwen; Wu, Mingyu; Chen, Zhihua; Liu, Xiaoli
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Diseño de guía y control integrado para la intercepción tridimensional basado en aprendizaje por refuerzo profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Algoritmos de aprendizaje por refuerzo profundo
Guía y control
Interceptación de misiles y objetivos
Funciones de recompensa
Agentes
Parámetros aerodinámicos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Este estudio aplica algoritmos de aprendizaje por refuerzo profundo a la guía y control integrados para la interceptación de misiles de alta maniobrabilidad en tres dimensiones. Se construyeron en la investigación un entorno dinámico, funciones de recompensa relacionadas con múltiples factores, agentes basados en el algoritmo de gradiente de política determinista profunda y señales de acción con aletas de cabeceo y guiñada como comandos de control, que controlan el misil para interceptar objetivos. En primer lugar, el sistema de interceptación de misiles incluye dinámicas como la inercia del misil, los parámetros aerodinámicos y los retrasos de las aletas. En segundo lugar, para mejorar la velocidad de convergencia y la precisión de la guía, se introdujo un factor de convergencia para la velocidad angular de la línea de visión del objetivo y métodos de filtro dual profundo en el diseño de la función de recompensa. El método propuesto en este documento se comparó luego con la navegación proporcional tradicional. A continuación, se llevaron a cabo muchas simulaciones sobre objetivos de alta maniobrabilidad con diferentes condiciones iniciales mediante aleatorización. Los resultados de la simulación numérica mostraron que la estrategia de guía propuesta tiene una mayor precisión de guía y una mayor robustez y capacidad de generalización frente a los parámetros aerodinámicos.
Descripción
Este estudio aplica algoritmos de aprendizaje por refuerzo profundo a la guía y control integrados para la interceptación de misiles de alta maniobrabilidad en tres dimensiones. Se construyeron en la investigación un entorno dinámico, funciones de recompensa relacionadas con múltiples factores, agentes basados en el algoritmo de gradiente de política determinista profunda y señales de acción con aletas de cabeceo y guiñada como comandos de control, que controlan el misil para interceptar objetivos. En primer lugar, el sistema de interceptación de misiles incluye dinámicas como la inercia del misil, los parámetros aerodinámicos y los retrasos de las aletas. En segundo lugar, para mejorar la velocidad de convergencia y la precisión de la guía, se introdujo un factor de convergencia para la velocidad angular de la línea de visión del objetivo y métodos de filtro dual profundo en el diseño de la función de recompensa. El método propuesto en este documento se comparó luego con la navegación proporcional tradicional. A continuación, se llevaron a cabo muchas simulaciones sobre objetivos de alta maniobrabilidad con diferentes condiciones iniciales mediante aleatorización. Los resultados de la simulación numérica mostraron que la estrategia de guía propuesta tiene una mayor precisión de guía y una mayor robustez y capacidad de generalización frente a los parámetros aerodinámicos.