logo móvil
Contáctanos

Hacia Juegos Adversariales No Tripulados Inteligentes: Un Marco de Aprendizaje por Refuerzo con el Método PHP-ROW

Autores: Shi, Guoqing; Cao, Yi; Wang, Dinghan; Yang, Qiming; Zhang, Jiandong; Shi, Zhuoyong

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Hacia Juegos Adversariales No Tripulados Inteligentes: Un Marco de Aprendizaje por Refuerzo con el Método PHP-ROW


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Marco
Control de maniobras
Conciencia situacional
UAVs
Aprendizaje profundo por refuerzo
PHP-ROW

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Este estudio presenta un nuevo marco para el control de maniobras BVR no tripuladas e inteligentes en el contexto de juegos adversariales. El énfasis se centra en tres aspectos fundamentales: la conciencia situacional, la toma de decisiones de maniobra y el control preciso de maniobras. Dentro de este paradigma, nuestros vehículos aéreos no tripulados (VANT) pueden asimilar información situacional crucial a través de vectores situacionales construidos y ejecutar maniobras sofisticadas, abordando eficazmente las complejidades de los entornos de vuelo dinámicos y diversos escenarios impredecibles dentro del contexto del juego. Para lograr un control de maniobras granular, esta investigación introduce el método de Peso de Observación Aleatoria de Encuesta de Rumbo Prioritario (PHP-ROW), respaldado por el aprendizaje por refuerzo profundo. Este enfoque integra dos componentes principales: (1) el mecanismo de encuesta de rumbo prioritario (PHP), que regula la extensión de las trayectorias de vuelo mientras enfatiza el control del rumbo, y (2) la técnica de peso de observación aleatoria (ROW), que modera hábilmente la influencia de las recompensas del ángulo de inclinación durante la fase de aprendizaje. La superioridad del método PHP-ROW se demuestra al contrastarlo con el algoritmo convencional de optimización de políticas proximales (PPO). En conclusión, la utilidad y eficacia del marco presentado se corroboran a través de simulaciones de juegos adversariales entre humanos y máquinas en un entorno hiperrealista. Esta investigación proporciona contribuciones teóricas y empíricas fundamentales al ámbito del control de maniobras aéreas no tripuladas e inteligentes, prometiendo implicaciones significativas para la evolución de la tecnología de aviación en contextos de juegos adversariales.

Otros recursos que podrían interesarte

Temas Virtualpro