Un Método de Control de Entrega de Cebo Inteligente para la Evasión de Vehículos Aéreos Basado en Aprendizaje por Refuerzo
Autores: Xue, Shuai; Wang, Zhaolei; Bai, Hongyang; Yu, Chunmei; Deng, Tianyu; Sun, Ruisheng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un Método de Control de Entrega de Cebo Inteligente para la Evasión de Vehículos Aéreos Basado en Aprendizaje por Refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Tecnología de cebo infrarrojo
Algoritmo DDPG
Control de lanzamiento de cebos
Proceso de decisión de Markov
Ataque de misiles
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
Durante el combate aéreo, cuando una aeronave se enfrenta a un ataque de misil aire-aire infrarrojo, la tecnología de cebado infrarrojo es un medio importante de penetración, y la estrategia de entrega efectiva del cebado infrarrojo es crítica. Para abordar este problema, este estudio propone un método de control inteligente de lanzamiento de cebos basado en un algoritmo mejorado de gradiente de política determinista profunda (DDPG). En primer lugar, al modelar el movimiento relativo entre la aeronave, el cebo y los misiles entrantes, se construyó el proceso de decisión de Markov del efecto infrarrojo de la aeronave-cebo-misil, utilizando la distancia visual y el ángulo de línea de visión como estados. Luego, se mejoró el algoritmo DDPG mediante preentrenamiento y muestreo de clasificación. Significativamente, la red de decisión de lanzamiento de cebos infrarrojos se entrenó a través de la interacción con el entorno y el aprendizaje iterativo, lo que llevó al desarrollo de la estrategia de lanzamiento de cebos. Finalmente, el entorno correspondiente se transfirió a la plataforma embebida Nvidia Jetson TX2 para pruebas comparativas. Los resultados de la simulación mostraron que la velocidad de convergencia de este método fue un 46.3% más rápida que la del algoritmo DDPG tradicional. Más importante aún, fue capaz de generar una estrategia efectiva de lanzamiento de cebos, permitiendo que la aeronave evadiera con éxito el ataque del misil entrante. El tiempo de generación de instrucciones de estrategia es de solo aproximadamente 2.5 ms, lo que le otorga la capacidad de tomar decisiones en línea.
Descripción
Durante el combate aéreo, cuando una aeronave se enfrenta a un ataque de misil aire-aire infrarrojo, la tecnología de cebado infrarrojo es un medio importante de penetración, y la estrategia de entrega efectiva del cebado infrarrojo es crítica. Para abordar este problema, este estudio propone un método de control inteligente de lanzamiento de cebos basado en un algoritmo mejorado de gradiente de política determinista profunda (DDPG). En primer lugar, al modelar el movimiento relativo entre la aeronave, el cebo y los misiles entrantes, se construyó el proceso de decisión de Markov del efecto infrarrojo de la aeronave-cebo-misil, utilizando la distancia visual y el ángulo de línea de visión como estados. Luego, se mejoró el algoritmo DDPG mediante preentrenamiento y muestreo de clasificación. Significativamente, la red de decisión de lanzamiento de cebos infrarrojos se entrenó a través de la interacción con el entorno y el aprendizaje iterativo, lo que llevó al desarrollo de la estrategia de lanzamiento de cebos. Finalmente, el entorno correspondiente se transfirió a la plataforma embebida Nvidia Jetson TX2 para pruebas comparativas. Los resultados de la simulación mostraron que la velocidad de convergencia de este método fue un 46.3% más rápida que la del algoritmo DDPG tradicional. Más importante aún, fue capaz de generar una estrategia efectiva de lanzamiento de cebos, permitiendo que la aeronave evadiera con éxito el ataque del misil entrante. El tiempo de generación de instrucciones de estrategia es de solo aproximadamente 2.5 ms, lo que le otorga la capacidad de tomar decisiones en línea.