Estrategias de Juego Inteligentes en el Compromiso de Defensor de Misiles Objetivo-Fallo Usando Aprendizaje por Refuerzo Profundo Basado en Currículo
Autores: Gong, Xiaopeng; Chen, Wanchun; Chen, Zhongyuan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estrategias de Juego Inteligentes en el Compromiso de Defensor de Misiles Objetivo-Fallo Usando Aprendizaje por Refuerzo Profundo Basado en Currículo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Ataque
Defensa
Estrategias de juego
Aprendizaje profundo por refuerzo
Misil
Objetivo/defensor
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Apuntando al problema del juego de ataque y defensa en el escenario de confrontación de tres cuerpos: objetivo-misil-defensor, se proponen estrategias de juego inteligentes basadas en el aprendizaje profundo por refuerzo, incluyendo una estrategia de ataque aplicable a misiles atacantes y una estrategia de defensa activa aplicable a un objetivo/defensor. Primero, basándose en la investigación clásica de tres cuerpos adversariales, se introduce el algoritmo de aprendizaje por refuerzo para mejorar la intencionalidad del entrenamiento del algoritmo. Se consideran los espacios de acción y las condiciones de recompensa y castigo de ambas confrontaciones de ataque y defensa en el diseño de la función de recompensa. A través del análisis del signo del espacio de acción y el diseño de la función de recompensa en la forma adversarial, se pueden satisfacer los requisitos de combate tanto en el entrenamiento del misil como en el del objetivo/defensor. Luego, se aplica un algoritmo de aprendizaje profundo por refuerzo basado en un currículo para entrenar a los agentes y se obtiene una estrategia de juego convergente. Los resultados de la simulación muestran que la estrategia de ataque del misil puede maniobrar de acuerdo con la situación del campo de batalla y puede golpear con éxito el objetivo después de evitar al defensor. La estrategia de defensa activa permite que el objetivo/defensor menos capaz logre un efecto similar a un ataque adversarial en red contra el agente misil, protegiendo a los objetivos de ataques de misiles con superior maniobrabilidad en el campo de batalla.
Descripción
Apuntando al problema del juego de ataque y defensa en el escenario de confrontación de tres cuerpos: objetivo-misil-defensor, se proponen estrategias de juego inteligentes basadas en el aprendizaje profundo por refuerzo, incluyendo una estrategia de ataque aplicable a misiles atacantes y una estrategia de defensa activa aplicable a un objetivo/defensor. Primero, basándose en la investigación clásica de tres cuerpos adversariales, se introduce el algoritmo de aprendizaje por refuerzo para mejorar la intencionalidad del entrenamiento del algoritmo. Se consideran los espacios de acción y las condiciones de recompensa y castigo de ambas confrontaciones de ataque y defensa en el diseño de la función de recompensa. A través del análisis del signo del espacio de acción y el diseño de la función de recompensa en la forma adversarial, se pueden satisfacer los requisitos de combate tanto en el entrenamiento del misil como en el del objetivo/defensor. Luego, se aplica un algoritmo de aprendizaje profundo por refuerzo basado en un currículo para entrenar a los agentes y se obtiene una estrategia de juego convergente. Los resultados de la simulación muestran que la estrategia de ataque del misil puede maniobrar de acuerdo con la situación del campo de batalla y puede golpear con éxito el objetivo después de evitar al defensor. La estrategia de defensa activa permite que el objetivo/defensor menos capaz logre un efecto similar a un ataque adversarial en red contra el agente misil, protegiendo a los objetivos de ataques de misiles con superior maniobrabilidad en el campo de batalla.