Decisión de Combate Aéreo Cooperativo Multi-UAV Basada en Actor-Crítico Doble Suave Multi-Agente
Autores: Li, Shaowei; Wang, Yongchao; Zhou, Yaoming; Jia, Yuhong; Shi, Hanyue; Yang, Fan; Zhang, Chaoyue
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Decisión de Combate Aéreo Cooperativo Multi-UAV Basada en Actor-Crítico Doble Suave Multi-Agente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Vehículo aéreo no tripulado
Combate aéreo cooperativo
Método de toma de decisiones
Actor-crítico de doble suavidad multiagente
Proceso de decisión de Markov parcialmente observable descentralizado
Teoría de la máxima entropía
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
El combate aéreo cooperativo de múltiples vehículos aéreos no tripulados (multi-UAV), que es una forma importante del combate aéreo futuro, tiene altos requisitos para la autonomía y cooperación de los vehículos aéreos no tripulados. Por lo tanto, es de gran importancia estudiar el método de toma de decisiones para el combate aéreo cooperativo de multi-UAV, ya que los métodos convencionales son difíciles de aplicar para resolver los problemas de combate aéreo cooperativo de alta complejidad y alta dinámica. Este documento propone un algoritmo de crítico de doble actor suave multi-agente (MADSAC) para resolver el problema de toma de decisiones cooperativas de multi-UAV. El MADSAC logra el combate aéreo cooperativo de multi-UAV al tratar el problema como un juego completamente cooperativo utilizando un proceso de decisión de Markov parcialmente observable descentralizado y un marco de ejecución distribuido entrenado centralmente. El uso de la teoría de máxima entropía en el proceso de actualización hace que el método sea más exploratorio. Mientras tanto, el MADSAC utiliza críticos centralizados dobles, redes objetivo y actualizaciones de políticas retrasadas para resolver de manera efectiva los problemas de sobreestimación y acumulación de errores. Además, los críticos centralizados dobles basados en el mecanismo de atención mejoran la escalabilidad y la eficiencia de aprendizaje del MADSAC. Finalmente, los experimentos de combate aéreo cooperativo de multi-UAV validan la efectividad del MADSAC.
Descripción
El combate aéreo cooperativo de múltiples vehículos aéreos no tripulados (multi-UAV), que es una forma importante del combate aéreo futuro, tiene altos requisitos para la autonomía y cooperación de los vehículos aéreos no tripulados. Por lo tanto, es de gran importancia estudiar el método de toma de decisiones para el combate aéreo cooperativo de multi-UAV, ya que los métodos convencionales son difíciles de aplicar para resolver los problemas de combate aéreo cooperativo de alta complejidad y alta dinámica. Este documento propone un algoritmo de crítico de doble actor suave multi-agente (MADSAC) para resolver el problema de toma de decisiones cooperativas de multi-UAV. El MADSAC logra el combate aéreo cooperativo de multi-UAV al tratar el problema como un juego completamente cooperativo utilizando un proceso de decisión de Markov parcialmente observable descentralizado y un marco de ejecución distribuido entrenado centralmente. El uso de la teoría de máxima entropía en el proceso de actualización hace que el método sea más exploratorio. Mientras tanto, el MADSAC utiliza críticos centralizados dobles, redes objetivo y actualizaciones de políticas retrasadas para resolver de manera efectiva los problemas de sobreestimación y acumulación de errores. Además, los críticos centralizados dobles basados en el mecanismo de atención mejoran la escalabilidad y la eficiencia de aprendizaje del MADSAC. Finalmente, los experimentos de combate aéreo cooperativo de multi-UAV validan la efectividad del MADSAC.