Rodeo Cooperativo y Evitación de Obstáculos de UAVs de Ala Fija a través de MADDPG con Aprendizaje por Currículo
Autores: Zhao, Xinrui; Tan, Jianwen; Meng, Wenyue; Yu, Ziping; Yan, Yongzhao; Zhang, Zijian
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Rodeo Cooperativo y Evitación de Obstáculos de UAVs de Ala Fija a través de MADDPG con Aprendizaje por Currículo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Cooperativa
Cerco
UAVs de ala fija
Evitación de obstáculos
Aprendizaje profundo por refuerzo
MADDPG
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las tareas de cercado cooperativo con múltiples UAV han atraído una considerable atención en áreas como la defensa militar y la interceptación de objetivos. Los UAV de ala fija enfrentan desafíos sustanciales debido a límites dinámicos intrínsecos, incluyendo su velocidad mínima y radio de giro, particularmente al involucrarse con objetivos evasivos y navegar en entornos con obstáculos. Este artículo presenta un enfoque híbrido de aprendizaje por refuerzo profundo, en el cual se desarrolla un entorno de tarea cooperativa para UAV de ala fija que integra conjuntamente el cercado y la evitación de obstáculos. Se diseña un marco compuesto MADDPG mejorado con aprendizaje por currículos, empleando una programación progresiva de tareas y optimización de recompensas para acelerar la convergencia y mejorar la estabilidad de la política. Los resultados de simulación demuestran que el método propuesto logra tasas de éxito de cercado de un solo paso que superan el 80% en entornos complejos, mientras mantiene tasas de éxito de 10 pasos alrededor del 70%, fortaleciendo así tanto la capacidad de cercado como la seguridad en la evitación de obstáculos en enjambres de UAV de ala fija. Este estudio proporciona nuevas perspectivas sobre el control cooperativo inteligente de UAV de ala fija en misiones de alto riesgo.
Descripción
Las tareas de cercado cooperativo con múltiples UAV han atraído una considerable atención en áreas como la defensa militar y la interceptación de objetivos. Los UAV de ala fija enfrentan desafíos sustanciales debido a límites dinámicos intrínsecos, incluyendo su velocidad mínima y radio de giro, particularmente al involucrarse con objetivos evasivos y navegar en entornos con obstáculos. Este artículo presenta un enfoque híbrido de aprendizaje por refuerzo profundo, en el cual se desarrolla un entorno de tarea cooperativa para UAV de ala fija que integra conjuntamente el cercado y la evitación de obstáculos. Se diseña un marco compuesto MADDPG mejorado con aprendizaje por currículos, empleando una programación progresiva de tareas y optimización de recompensas para acelerar la convergencia y mejorar la estabilidad de la política. Los resultados de simulación demuestran que el método propuesto logra tasas de éxito de cercado de un solo paso que superan el 80% en entornos complejos, mientras mantiene tasas de éxito de 10 pasos alrededor del 70%, fortaleciendo así tanto la capacidad de cercado como la seguridad en la evitación de obstáculos en enjambres de UAV de ala fija. Este estudio proporciona nuevas perspectivas sobre el control cooperativo inteligente de UAV de ala fija en misiones de alto riesgo.