logo móvil
Contáctanos

Aplicación del Aprendizaje por Refuerzo Profundo a Estrategias de Defensa e Intrusión Usando Vehículos Aéreos No Tripulados en un Juego de Versus

Autores: Chen, Chieh-Li; Huang, Yu-Wen; Shen, Ting-Ju

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Aplicación del Aprendizaje por Refuerzo Profundo a Estrategias de Defensa e Intrusión Usando Vehículos Aéreos No Tripulados en un Juego de Versus


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Drones
Algoritmos
Aprendizaje por refuerzo profundo
Modelado físico
Estrategias de combate
Habilidades de vuelo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los drones se utilizan en escenas complejas en diferentes escenarios. Se requieren algoritmos eficientes y efectivos para que los drones rastreen objetivos de interés y protejan objetivos aliados en un juego de versus. Este estudio utilizó modelos físicos de cuadricópteros y motores de escena para investigar el rendimiento resultante de los drones atacantes y defensores basados en el aprendizaje por refuerzo profundo. La red de aprendizaje por refuerzo profundo soft actor-critic se aplicó en asociación con las funciones de recompensa y penalización propuestas de acuerdo con el escenario de diseño. Se utilizaron modelos físicos de UAV de AirSim y escenarios de misión basados en Unreal Engine para entrenar simultáneamente las habilidades de juego de ataque y defensa para ambos drones, de modo que las estrategias de combate y las habilidades de vuelo requeridas pudieran mejorarse a través de una serie de episodios de competencia. Después de 500 episodios de experiencia práctica, ambos drones pudieron acelerar, desviar y evadir para lograr un rendimiento razonablemente bueno con una situación de empate aproximada. Los escenarios de validación también demostraron que la proporción de victorias del atacante-defensor mejoró de 1:2 a 1.2:1, lo cual es razonable para drones con capacidades de vuelo iguales. Aunque esto mostró que el atacante puede tener una ventaja en escenarios inexpertos, reveló que las estrategias generadas por las redes de aprendizaje por refuerzo profundo son robustas y factibles.

Otros recursos que podrían interesarte

Temas Virtualpro