Hacia Juegos Adversariales No Tripulados Inteligentes: Un Marco de Aprendizaje por Refuerzo con el Método PHP-ROW

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Hacia Juegos Adversariales No Tripulados Inteligentes: Un Marco de Aprendizaje por Refuerzo con el Método PHP-ROW

Autores: Shi, Guoqing; Cao, Yi; Wang, Dinghan; Yang, Qiming; Zhang, Jiandong; Shi, Zhuoyong

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

Hacia Juegos Adversariales No Tripulados Inteligentes: Un Marco de Aprendizaje por Refuerzo con el Método PHP-ROW

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Marco

Control de maniobras

Conciencia situacional

UAVs

Aprendizaje profundo por refuerzo

PHP-ROW

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Este estudio presenta un nuevo marco para el control de maniobras BVR no tripuladas e inteligentes en el contexto de juegos adversariales. El énfasis se centra en tres aspectos fundamentales: la conciencia situacional, la toma de decisiones de maniobra y el control preciso de maniobras. Dentro de este paradigma, nuestros vehículos aéreos no tripulados (VANT) pueden asimilar información situacional crucial a través de vectores situacionales construidos y ejecutar maniobras sofisticadas, abordando eficazmente las complejidades de los entornos de vuelo dinámicos y diversos escenarios impredecibles dentro del contexto del juego. Para lograr un control de maniobras granular, esta investigación introduce el método de Peso de Observación Aleatoria de Encuesta de Rumbo Prioritario (PHP-ROW), respaldado por el aprendizaje por refuerzo profundo. Este enfoque integra dos componentes principales: (1) el mecanismo de encuesta de rumbo prioritario (PHP), que regula la extensión de las trayectorias de vuelo mientras enfatiza el control del rumbo, y (2) la técnica de peso de observación aleatoria (ROW), que modera hábilmente la influencia de las recompensas del ángulo de inclinación durante la fase de aprendizaje. La superioridad del método PHP-ROW se demuestra al contrastarlo con el algoritmo convencional de optimización de políticas proximales (PPO). En conclusión, la utilidad y eficacia del marco presentado se corroboran a través de simulaciones de juegos adversariales entre humanos y máquinas en un entorno hiperrealista. Esta investigación proporciona contribuciones teóricas y empíricas fundamentales al ámbito del control de maniobras aéreas no tripuladas e inteligentes, prometiendo implicaciones significativas para la evolución de la tecnología de aviación en contextos de juegos adversariales.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro