Un Método de Control de Entrega de Cebo Inteligente para la Evasión de Vehículos Aéreos Basado en Aprendizaje por Refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un Método de Control de Entrega de Cebo Inteligente para la Evasión de Vehículos Aéreos Basado en Aprendizaje por Refuerzo

Autores: Xue, Shuai; Wang, Zhaolei; Bai, Hongyang; Yu, Chunmei; Deng, Tianyu; Sun, Ruisheng

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Un Método de Control de Entrega de Cebo Inteligente para la Evasión de Vehículos Aéreos Basado en Aprendizaje por Refuerzo

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Aeroespacial

Palabras clave

Tecnología de cebo infrarrojo

Algoritmo DDPG

Control de lanzamiento de cebos

Proceso de decisión de Markov

Ataque de misiles

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 15

Citaciones: Sin citaciones

Durante el combate aéreo, cuando una aeronave se enfrenta a un ataque de misil aire-aire infrarrojo, la tecnología de cebado infrarrojo es un medio importante de penetración, y la estrategia de entrega efectiva del cebado infrarrojo es crítica. Para abordar este problema, este estudio propone un método de control inteligente de lanzamiento de cebos basado en un algoritmo mejorado de gradiente de política determinista profunda (DDPG). En primer lugar, al modelar el movimiento relativo entre la aeronave, el cebo y los misiles entrantes, se construyó el proceso de decisión de Markov del efecto infrarrojo de la aeronave-cebo-misil, utilizando la distancia visual y el ángulo de línea de visión como estados. Luego, se mejoró el algoritmo DDPG mediante preentrenamiento y muestreo de clasificación. Significativamente, la red de decisión de lanzamiento de cebos infrarrojos se entrenó a través de la interacción con el entorno y el aprendizaje iterativo, lo que llevó al desarrollo de la estrategia de lanzamiento de cebos. Finalmente, el entorno correspondiente se transfirió a la plataforma embebida Nvidia Jetson TX2 para pruebas comparativas. Los resultados de la simulación mostraron que la velocidad de convergencia de este método fue un 46.3% más rápida que la del algoritmo DDPG tradicional. Más importante aún, fue capaz de generar una estrategia efectiva de lanzamiento de cebos, permitiendo que la aeronave evadiera con éxito el ataque del misil entrante. El tiempo de generación de instrucciones de estrategia es de solo aproximadamente 2.5 ms, lo que le otorga la capacidad de tomar decisiones en línea.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro