Investigación sobre la toma de decisiones de maniobra autónoma en juegos de suma cero aéreos de dos jugadores dentro del alcance visual basada en aprendizaje profundo por refuerzo

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Investigación sobre la toma de decisiones de maniobra autónoma en juegos de suma cero aéreos de dos jugadores dentro del alcance visual basada en aprendizaje profundo por refuerzo

Autores: Lu, Bo; Ru, Le; Hu, Shiguang; Wang, Wenfei; Xi, Hailong; Zhao, Xiaolin

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Investigación sobre la toma de decisiones de maniobra autónoma en juegos de suma cero aéreos de dos jugadores dentro del alcance visual basada en aprendizaje profundo por refuerzo

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Desarrollo

Tecnología

Toma de decisiones autónoma

Aprendizaje profundo por refuerzo

Combate aéreo

Algoritmos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones

En los últimos años, con el desarrollo acelerado de la tecnología hacia la automatización y la inteligencia, las capacidades de toma de decisiones autónomas en sistemas no tripulados están listas para desempeñar un papel crucial en los juegos de suma cero aéreos contemporáneos entre dos jugadores (TZSGs). Los métodos de aprendizaje profundo por refuerzo (DRL) permiten a los agentes tomar decisiones de maniobra de forma autónoma. Este documento se centra en los algoritmos DRL de corriente principal basados en maniobras tácticas fundamentales, seleccionando un escenario típico de combate aéreo TZSG dentro del alcance visual (WVR). Modelamos los elementos clave que influyen en el juego utilizando un proceso de decisión de Markov (MDP) y demostramos la base matemática para implementar DRL. Aprovechando software de simulación de alta fidelidad (Warsim v1.0), diseñamos un escenario prototípico de combate aéreo a corta distancia. Utilizando este entorno, entrenamos algoritmos DRL de corriente principal y analizamos los resultados del entrenamiento. Se resume la efectividad de estos algoritmos en permitir que los agentes maniobren en TZSG aéreos de forma autónoma, proporcionando una base fundamental para investigaciones futuras.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro