Investigación sobre la toma de decisiones de maniobra autónoma en juegos de suma cero aéreos de dos jugadores dentro del alcance visual basada en aprendizaje profundo por refuerzo
Autores: Lu, Bo; Ru, Le; Hu, Shiguang; Wang, Wenfei; Xi, Hailong; Zhao, Xiaolin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Investigación sobre la toma de decisiones de maniobra autónoma en juegos de suma cero aéreos de dos jugadores dentro del alcance visual basada en aprendizaje profundo por refuerzo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Desarrollo
Tecnología
Toma de decisiones autónoma
Aprendizaje profundo por refuerzo
Combate aéreo
Algoritmos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
En los últimos años, con el desarrollo acelerado de la tecnología hacia la automatización y la inteligencia, las capacidades de toma de decisiones autónomas en sistemas no tripulados están listas para desempeñar un papel crucial en los juegos de suma cero aéreos contemporáneos entre dos jugadores (TZSGs). Los métodos de aprendizaje profundo por refuerzo (DRL) permiten a los agentes tomar decisiones de maniobra de forma autónoma. Este documento se centra en los algoritmos DRL de corriente principal basados en maniobras tácticas fundamentales, seleccionando un escenario típico de combate aéreo TZSG dentro del alcance visual (WVR). Modelamos los elementos clave que influyen en el juego utilizando un proceso de decisión de Markov (MDP) y demostramos la base matemática para implementar DRL. Aprovechando software de simulación de alta fidelidad (Warsim v1.0), diseñamos un escenario prototípico de combate aéreo a corta distancia. Utilizando este entorno, entrenamos algoritmos DRL de corriente principal y analizamos los resultados del entrenamiento. Se resume la efectividad de estos algoritmos en permitir que los agentes maniobren en TZSG aéreos de forma autónoma, proporcionando una base fundamental para investigaciones futuras.
Descripción
En los últimos años, con el desarrollo acelerado de la tecnología hacia la automatización y la inteligencia, las capacidades de toma de decisiones autónomas en sistemas no tripulados están listas para desempeñar un papel crucial en los juegos de suma cero aéreos contemporáneos entre dos jugadores (TZSGs). Los métodos de aprendizaje profundo por refuerzo (DRL) permiten a los agentes tomar decisiones de maniobra de forma autónoma. Este documento se centra en los algoritmos DRL de corriente principal basados en maniobras tácticas fundamentales, seleccionando un escenario típico de combate aéreo TZSG dentro del alcance visual (WVR). Modelamos los elementos clave que influyen en el juego utilizando un proceso de decisión de Markov (MDP) y demostramos la base matemática para implementar DRL. Aprovechando software de simulación de alta fidelidad (Warsim v1.0), diseñamos un escenario prototípico de combate aéreo a corta distancia. Utilizando este entorno, entrenamos algoritmos DRL de corriente principal y analizamos los resultados del entrenamiento. Se resume la efectividad de estos algoritmos en permitir que los agentes maniobren en TZSG aéreos de forma autónoma, proporcionando una base fundamental para investigaciones futuras.