Control de Formación de Enjambres de UAV Consciente de Retrasos a través del Aprendizaje por Imitación de Políticas de Expertos ARD-PF
Autores: Vera-Amaro, Rodolfo; Luviano-Juárez, Alberto; Rivero-Ángeles, Mario E.
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Control de Formación de Enjambres de UAV Consciente de Retrasos a través del Aprendizaje por Imitación de Políticas de Expertos ARD-PF
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Control de formación
Consciente del retraso
Enjambres de UAV
Latencia de comunicación
Aprendizaje por imitación
Robusto ante retrasos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento estudia el control de formación consciente del retraso para enjambres de vehículos aéreos no tripulados (UAV) que operan bajo una latencia de comunicación aire-aire realista. Se utiliza un controlador basado en un campo potencial de distancia atractiva-repulsa (ARD-PF) como experto para generar demostraciones para el aprendizaje por imitación en sistemas cooperativos de múltiples UAV. Al aumentar los datos de entrenamiento con el retraso de comunicación, la política aprendida compensa implícitamente la información desactualizada de los vecinos y mejora la coordinación del enjambre durante el vuelo autónomo. Simulaciones extensas en diferentes tamaños de enjambre, espacios de formación y niveles de retraso muestran que el aprendizaje por imitación robusto al retraso amplía significativamente la región de estabilidad probabilística en comparación con el control clásico ARD-PF y las líneas base de aprendizaje no robusto. El rendimiento del control de formación se evalúa utilizando error geométrico interno, desplazamiento global y métricas de estabilidad en múltiples ejecuciones. Además, se introduce un modelo de estabilidad de retraso predictivo, que vincula el retraso de comunicación máximo admisible con el tamaño del enjambre y el espaciado entre agentes, con un bajo error de ajuste contra los límites de estabilidad simulados. Los resultados proporcionan información cuantitativa para diseñar sistemas de enjambres de UAV conscientes de la comunicación bajo restricciones de latencia.
Descripción
Este documento estudia el control de formación consciente del retraso para enjambres de vehículos aéreos no tripulados (UAV) que operan bajo una latencia de comunicación aire-aire realista. Se utiliza un controlador basado en un campo potencial de distancia atractiva-repulsa (ARD-PF) como experto para generar demostraciones para el aprendizaje por imitación en sistemas cooperativos de múltiples UAV. Al aumentar los datos de entrenamiento con el retraso de comunicación, la política aprendida compensa implícitamente la información desactualizada de los vecinos y mejora la coordinación del enjambre durante el vuelo autónomo. Simulaciones extensas en diferentes tamaños de enjambre, espacios de formación y niveles de retraso muestran que el aprendizaje por imitación robusto al retraso amplía significativamente la región de estabilidad probabilística en comparación con el control clásico ARD-PF y las líneas base de aprendizaje no robusto. El rendimiento del control de formación se evalúa utilizando error geométrico interno, desplazamiento global y métricas de estabilidad en múltiples ejecuciones. Además, se introduce un modelo de estabilidad de retraso predictivo, que vincula el retraso de comunicación máximo admisible con el tamaño del enjambre y el espaciado entre agentes, con un bajo error de ajuste contra los límites de estabilidad simulados. Los resultados proporcionan información cuantitativa para diseñar sistemas de enjambres de UAV conscientes de la comunicación bajo restricciones de latencia.