Aplicación del Aprendizaje por Refuerzo Profundo a Estrategias de Defensa e Intrusión Usando Vehículos Aéreos No Tripulados en un Juego de Versus
Autores: Chen, Chieh-Li; Huang, Yu-Wen; Shen, Ting-Ju
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aplicación del Aprendizaje por Refuerzo Profundo a Estrategias de Defensa e Intrusión Usando Vehículos Aéreos No Tripulados en un Juego de Versus
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Drones
Algoritmos
Aprendizaje por refuerzo profundo
Modelado físico
Estrategias de combate
Habilidades de vuelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los drones se utilizan en escenas complejas en diferentes escenarios. Se requieren algoritmos eficientes y efectivos para que los drones rastreen objetivos de interés y protejan objetivos aliados en un juego de versus. Este estudio utilizó modelos físicos de cuadricópteros y motores de escena para investigar el rendimiento resultante de los drones atacantes y defensores basados en el aprendizaje por refuerzo profundo. La red de aprendizaje por refuerzo profundo soft actor-critic se aplicó en asociación con las funciones de recompensa y penalización propuestas de acuerdo con el escenario de diseño. Se utilizaron modelos físicos de UAV de AirSim y escenarios de misión basados en Unreal Engine para entrenar simultáneamente las habilidades de juego de ataque y defensa para ambos drones, de modo que las estrategias de combate y las habilidades de vuelo requeridas pudieran mejorarse a través de una serie de episodios de competencia. Después de 500 episodios de experiencia práctica, ambos drones pudieron acelerar, desviar y evadir para lograr un rendimiento razonablemente bueno con una situación de empate aproximada. Los escenarios de validación también demostraron que la proporción de victorias del atacante-defensor mejoró de 1:2 a 1.2:1, lo cual es razonable para drones con capacidades de vuelo iguales. Aunque esto mostró que el atacante puede tener una ventaja en escenarios inexpertos, reveló que las estrategias generadas por las redes de aprendizaje por refuerzo profundo son robustas y factibles.
Descripción
Los drones se utilizan en escenas complejas en diferentes escenarios. Se requieren algoritmos eficientes y efectivos para que los drones rastreen objetivos de interés y protejan objetivos aliados en un juego de versus. Este estudio utilizó modelos físicos de cuadricópteros y motores de escena para investigar el rendimiento resultante de los drones atacantes y defensores basados en el aprendizaje por refuerzo profundo. La red de aprendizaje por refuerzo profundo soft actor-critic se aplicó en asociación con las funciones de recompensa y penalización propuestas de acuerdo con el escenario de diseño. Se utilizaron modelos físicos de UAV de AirSim y escenarios de misión basados en Unreal Engine para entrenar simultáneamente las habilidades de juego de ataque y defensa para ambos drones, de modo que las estrategias de combate y las habilidades de vuelo requeridas pudieran mejorarse a través de una serie de episodios de competencia. Después de 500 episodios de experiencia práctica, ambos drones pudieron acelerar, desviar y evadir para lograr un rendimiento razonablemente bueno con una situación de empate aproximada. Los escenarios de validación también demostraron que la proporción de victorias del atacante-defensor mejoró de 1:2 a 1.2:1, lo cual es razonable para drones con capacidades de vuelo iguales. Aunque esto mostró que el atacante puede tener una ventaja en escenarios inexpertos, reveló que las estrategias generadas por las redes de aprendizaje por refuerzo profundo son robustas y factibles.