Hacia Juegos Adversariales No Tripulados Inteligentes: Un Marco de Aprendizaje por Refuerzo con el Método PHP-ROW
Autores: Shi, Guoqing; Cao, Yi; Wang, Dinghan; Yang, Qiming; Zhang, Jiandong; Shi, Zhuoyong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Hacia Juegos Adversariales No Tripulados Inteligentes: Un Marco de Aprendizaje por Refuerzo con el Método PHP-ROW
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Marco
Control de maniobras
Conciencia situacional
UAVs
Aprendizaje profundo por refuerzo
PHP-ROW
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio presenta un nuevo marco para el control de maniobras BVR no tripuladas e inteligentes en el contexto de juegos adversariales. El énfasis se centra en tres aspectos fundamentales: la conciencia situacional, la toma de decisiones de maniobra y el control preciso de maniobras. Dentro de este paradigma, nuestros vehículos aéreos no tripulados (VANT) pueden asimilar información situacional crucial a través de vectores situacionales construidos y ejecutar maniobras sofisticadas, abordando eficazmente las complejidades de los entornos de vuelo dinámicos y diversos escenarios impredecibles dentro del contexto del juego. Para lograr un control de maniobras granular, esta investigación introduce el método de Peso de Observación Aleatoria de Encuesta de Rumbo Prioritario (PHP-ROW), respaldado por el aprendizaje por refuerzo profundo. Este enfoque integra dos componentes principales: (1) el mecanismo de encuesta de rumbo prioritario (PHP), que regula la extensión de las trayectorias de vuelo mientras enfatiza el control del rumbo, y (2) la técnica de peso de observación aleatoria (ROW), que modera hábilmente la influencia de las recompensas del ángulo de inclinación durante la fase de aprendizaje. La superioridad del método PHP-ROW se demuestra al contrastarlo con el algoritmo convencional de optimización de políticas proximales (PPO). En conclusión, la utilidad y eficacia del marco presentado se corroboran a través de simulaciones de juegos adversariales entre humanos y máquinas en un entorno hiperrealista. Esta investigación proporciona contribuciones teóricas y empíricas fundamentales al ámbito del control de maniobras aéreas no tripuladas e inteligentes, prometiendo implicaciones significativas para la evolución de la tecnología de aviación en contextos de juegos adversariales.
Descripción
Este estudio presenta un nuevo marco para el control de maniobras BVR no tripuladas e inteligentes en el contexto de juegos adversariales. El énfasis se centra en tres aspectos fundamentales: la conciencia situacional, la toma de decisiones de maniobra y el control preciso de maniobras. Dentro de este paradigma, nuestros vehículos aéreos no tripulados (VANT) pueden asimilar información situacional crucial a través de vectores situacionales construidos y ejecutar maniobras sofisticadas, abordando eficazmente las complejidades de los entornos de vuelo dinámicos y diversos escenarios impredecibles dentro del contexto del juego. Para lograr un control de maniobras granular, esta investigación introduce el método de Peso de Observación Aleatoria de Encuesta de Rumbo Prioritario (PHP-ROW), respaldado por el aprendizaje por refuerzo profundo. Este enfoque integra dos componentes principales: (1) el mecanismo de encuesta de rumbo prioritario (PHP), que regula la extensión de las trayectorias de vuelo mientras enfatiza el control del rumbo, y (2) la técnica de peso de observación aleatoria (ROW), que modera hábilmente la influencia de las recompensas del ángulo de inclinación durante la fase de aprendizaje. La superioridad del método PHP-ROW se demuestra al contrastarlo con el algoritmo convencional de optimización de políticas proximales (PPO). En conclusión, la utilidad y eficacia del marco presentado se corroboran a través de simulaciones de juegos adversariales entre humanos y máquinas en un entorno hiperrealista. Esta investigación proporciona contribuciones teóricas y empíricas fundamentales al ámbito del control de maniobras aéreas no tripuladas e inteligentes, prometiendo implicaciones significativas para la evolución de la tecnología de aviación en contextos de juegos adversariales.