Aplicación del Aprendizaje por Refuerzo Profundo a Estrategias de Defensa e Intrusión Usando Vehículos Aéreos No Tripulados en un Juego de Versus

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Aplicación del Aprendizaje por Refuerzo Profundo a Estrategias de Defensa e Intrusión Usando Vehículos Aéreos No Tripulados en un Juego de Versus

Autores: Chen, Chieh-Li; Huang, Yu-Wen; Shen, Ting-Ju

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Aplicación del Aprendizaje por Refuerzo Profundo a Estrategias de Defensa e Intrusión Usando Vehículos Aéreos No Tripulados en un Juego de Versus

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Drones

Algoritmos

Aprendizaje por refuerzo profundo

Modelado físico

Estrategias de combate

Habilidades de vuelo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Los drones se utilizan en escenas complejas en diferentes escenarios. Se requieren algoritmos eficientes y efectivos para que los drones rastreen objetivos de interés y protejan objetivos aliados en un juego de versus. Este estudio utilizó modelos físicos de cuadricópteros y motores de escena para investigar el rendimiento resultante de los drones atacantes y defensores basados en el aprendizaje por refuerzo profundo. La red de aprendizaje por refuerzo profundo soft actor-critic se aplicó en asociación con las funciones de recompensa y penalización propuestas de acuerdo con el escenario de diseño. Se utilizaron modelos físicos de UAV de AirSim y escenarios de misión basados en Unreal Engine para entrenar simultáneamente las habilidades de juego de ataque y defensa para ambos drones, de modo que las estrategias de combate y las habilidades de vuelo requeridas pudieran mejorarse a través de una serie de episodios de competencia. Después de 500 episodios de experiencia práctica, ambos drones pudieron acelerar, desviar y evadir para lograr un rendimiento razonablemente bueno con una situación de empate aproximada. Los escenarios de validación también demostraron que la proporción de victorias del atacante-defensor mejoró de 1:2 a 1.2:1, lo cual es razonable para drones con capacidades de vuelo iguales. Aunque esto mostró que el atacante puede tener una ventaja en escenarios inexpertos, reveló que las estrategias generadas por las redes de aprendizaje por refuerzo profundo son robustas y factibles.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro