Control de Consenso Óptimo Robusto para Sistemas Multi-Agente con Perturbaciones
Autores: Liu, Jun; Luo, Kuan; Li, Ping; Pu, Ming; Wang, Changyou
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Control de Consenso Óptimo Robusto para Sistemas Multi-Agente con Perturbaciones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Estrategias de control
Sistemas multiagente
Perturbaciones
Rendimiento de consenso
Controlador óptimo
Rechazo de perturbaciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El propósito de este artículo es desarrollar estrategias de control óptimas para sistemas multi-agente de tiempo discreto (DT-MAS) con perturbaciones desconocidas, con el objetivo de mejorar su rendimiento de consenso y sus capacidades de rechazo de perturbaciones. Las condiciones de vuelo complejas, como el escenario de vehículos aéreos no tripulados múltiples (multi-UAV) manteniendo consenso bajo ráfagas de viento fuertes, presentan desafíos significativos para el control de MAS. Para abordar estos desafíos, este artículo desarrolla un controlador óptimo para MAS basados en UAV con perturbaciones desconocidas para alcanzar consenso. Primero, se diseña un novedoso observador de estado extendido no lineal mejorado (INESO) para estimar perturbaciones en tiempo real, acompañado de un esquema de compensación de perturbaciones correspondiente. Posteriormente, se establecen los sistemas de error de consenso y las funciones de costo basadas en los DT-MAS libres de perturbaciones. A partir de esto, se propone un algoritmo iterativo de políticas basado en una red Actor-Critic acelerada por momento para los DT-MAS libres de perturbaciones para sintetizar un controlador de consenso óptimo, cuya integración con el esquema de compensación de perturbaciones produce un controlador óptimo de rechazo de perturbaciones para los DT-MAS afectados por perturbaciones para lograr control de consenso. Un análisis cuantitativo comparativo demuestra mejoras significativas en el rendimiento en comparación con una red Actor-Critic estándar: el enfoque propuesto reduce el tiempo de convergencia en un 12.8%, mejora la precisión de la posición en estado estacionario en un 22.7%, mejora la precisión de orientación en un 42.1% y reduce el sobreimpulso en un 22.7%. Finalmente, las simulaciones numéricas confirman la eficacia y superioridad del método.
Descripción
El propósito de este artículo es desarrollar estrategias de control óptimas para sistemas multi-agente de tiempo discreto (DT-MAS) con perturbaciones desconocidas, con el objetivo de mejorar su rendimiento de consenso y sus capacidades de rechazo de perturbaciones. Las condiciones de vuelo complejas, como el escenario de vehículos aéreos no tripulados múltiples (multi-UAV) manteniendo consenso bajo ráfagas de viento fuertes, presentan desafíos significativos para el control de MAS. Para abordar estos desafíos, este artículo desarrolla un controlador óptimo para MAS basados en UAV con perturbaciones desconocidas para alcanzar consenso. Primero, se diseña un novedoso observador de estado extendido no lineal mejorado (INESO) para estimar perturbaciones en tiempo real, acompañado de un esquema de compensación de perturbaciones correspondiente. Posteriormente, se establecen los sistemas de error de consenso y las funciones de costo basadas en los DT-MAS libres de perturbaciones. A partir de esto, se propone un algoritmo iterativo de políticas basado en una red Actor-Critic acelerada por momento para los DT-MAS libres de perturbaciones para sintetizar un controlador de consenso óptimo, cuya integración con el esquema de compensación de perturbaciones produce un controlador óptimo de rechazo de perturbaciones para los DT-MAS afectados por perturbaciones para lograr control de consenso. Un análisis cuantitativo comparativo demuestra mejoras significativas en el rendimiento en comparación con una red Actor-Critic estándar: el enfoque propuesto reduce el tiempo de convergencia en un 12.8%, mejora la precisión de la posición en estado estacionario en un 22.7%, mejora la precisión de orientación en un 42.1% y reduce el sobreimpulso en un 22.7%. Finalmente, las simulaciones numéricas confirman la eficacia y superioridad del método.