Un método de toma de decisiones cooperativas Multi-UCAV basado en un algoritmo MAPPO para combate aéreo más allá del alcance visual
Autores: Liu, Xiaoxiong; Yin, Yi; Su, Yuzhan; Ming, Ruichen
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un método de toma de decisiones cooperativas Multi-UCAV basado en un algoritmo MAPPO para combate aéreo más allá del alcance visual
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Problemas
Toma de decisiones autónoma
Operación cooperativa
Vehículos aéreos de combate no tripulados
Combate aéreo
Optimización de políticas proximales multiagente
Algoritmo MAPPO
Plataforma de simulación
Biblioteca de maniobras
Más allá del alcance visual
Aprendizaje por refuerzo
Función de recompensa integral
Entrenamiento centralizado
Implementación distribuida
Eficiencia de entrenamiento
Algoritmo
Múltiples aeronaves
Ejercicio de confrontación
Decisiones tácticas
UCAV.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Para resolver los problemas de toma de decisiones autónomas y la operación cooperativa de múltiples vehículos aéreos de combate no tripulados (UCAV) en combate aéreo más allá del alcance visual, este documento propone un método de toma de decisiones en combate aéreo basado en un algoritmo de optimización de políticas proximales de múltiples agentes (MAPPO). En primer lugar, se establece el modelo del avión de combate no tripulado en la plataforma de simulación y se diseña la biblioteca de maniobras correspondiente. Con el fin de simular el verdadero combate aéreo más allá del alcance visual, se establece el modelo del área de ataque de misiles y se da la probabilidad de que ocurra daño tanto para el enemigo como para nosotros. En segundo lugar, para superar el problema de retorno escaso del aprendizaje por refuerzo tradicional, de acuerdo con el ángulo, velocidad, altitud, distancia del avión de combate no tripulado y el daño del área de ataque de misiles, este documento diseña una función de recompensa integral. Finalmente, se adopta la idea de entrenamiento centralizado e implementación distribuida para mejorar la capacidad de toma de decisiones del avión de combate no tripulado y mejorar la eficiencia de entrenamiento del algoritmo. Los resultados de la simulación muestran que este algoritmo puede llevar a cabo un ejercicio de confrontación de combate aéreo multiavión, formar nuevas decisiones tácticas en el proceso del ejercicio y proporcionar nuevas ideas para el combate aéreo multi-UCAV.
Descripción
Para resolver los problemas de toma de decisiones autónomas y la operación cooperativa de múltiples vehículos aéreos de combate no tripulados (UCAV) en combate aéreo más allá del alcance visual, este documento propone un método de toma de decisiones en combate aéreo basado en un algoritmo de optimización de políticas proximales de múltiples agentes (MAPPO). En primer lugar, se establece el modelo del avión de combate no tripulado en la plataforma de simulación y se diseña la biblioteca de maniobras correspondiente. Con el fin de simular el verdadero combate aéreo más allá del alcance visual, se establece el modelo del área de ataque de misiles y se da la probabilidad de que ocurra daño tanto para el enemigo como para nosotros. En segundo lugar, para superar el problema de retorno escaso del aprendizaje por refuerzo tradicional, de acuerdo con el ángulo, velocidad, altitud, distancia del avión de combate no tripulado y el daño del área de ataque de misiles, este documento diseña una función de recompensa integral. Finalmente, se adopta la idea de entrenamiento centralizado e implementación distribuida para mejorar la capacidad de toma de decisiones del avión de combate no tripulado y mejorar la eficiencia de entrenamiento del algoritmo. Los resultados de la simulación muestran que este algoritmo puede llevar a cabo un ejercicio de confrontación de combate aéreo multiavión, formar nuevas decisiones tácticas en el proceso del ejercicio y proporcionar nuevas ideas para el combate aéreo multi-UCAV.