Enfoque de Seguimiento de Objetivos y Cercado Basado en Juegos de Potencial Estocástico para un Sistema de Múltiples Vehículos Aéreos No Tripulados
Autores: Yang, Kejie; Zhu, Ming; Guo, Xiao; Zhang, Yifei; Zhou, Yuting
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Enfoque de Seguimiento de Objetivos y Cercado Basado en Juegos de Potencial Estocástico para un Sistema de Múltiples Vehículos Aéreos No Tripulados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Algoritmos de control inteligente distribuido
Vehículos aéreos no tripulados
Seguimiento de objetivos
Misiones de cerco
Marco de juego potencial estocástico
Aprendizaje por refuerzo multiagente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La utilización de algoritmos de control inteligente totalmente distribuidos ha permitido la adopción gradual del sistema de múltiples vehículos aéreos no tripulados para ejecutar misiones de seguimiento y cercado de objetivos en aplicaciones industriales y civiles. Restringidos por el comportamiento de evasión del objetivo, los estudios actuales se centran en construir configuraciones de juegos de suma cero, y los solucionadores de estrategias existentes que acomodan espacios de estado-acción continuos han mostrado un rendimiento solo modesto. Para abordar los desafíos mencionados, diseñamos un marco de Juego Potencial Estocástico para modelar el escenario de la misión, considerando la limitada observabilidad del entorno. Además, se propone un método de aprendizaje por refuerzo multiagente para estimar la estrategia de equilibrio de Nash cercana en el escenario de juego mencionado, que utiliza información cinemática relativa en serie temporal y observación de obstáculos. Además, considerando la evitación de colisiones y el seguimiento cooperativo, se presentan varias técnicas, como funciones de recompensa novedosas y estructuras de redes recurrentes, para optimizar el proceso de entrenamiento. Los resultados de simulaciones numéricas demuestran que el método propuesto exhibe una capacidad de búsqueda superior para estrategias de Nash. Además, a través de experimentos virtuales dinámicos realizados con controladores de velocidad y actitud, se ha demostrado que los actores bien entrenados pueden actuar efectivamente como navegadores prácticos para el control de enjambres en tiempo real.
Descripción
La utilización de algoritmos de control inteligente totalmente distribuidos ha permitido la adopción gradual del sistema de múltiples vehículos aéreos no tripulados para ejecutar misiones de seguimiento y cercado de objetivos en aplicaciones industriales y civiles. Restringidos por el comportamiento de evasión del objetivo, los estudios actuales se centran en construir configuraciones de juegos de suma cero, y los solucionadores de estrategias existentes que acomodan espacios de estado-acción continuos han mostrado un rendimiento solo modesto. Para abordar los desafíos mencionados, diseñamos un marco de Juego Potencial Estocástico para modelar el escenario de la misión, considerando la limitada observabilidad del entorno. Además, se propone un método de aprendizaje por refuerzo multiagente para estimar la estrategia de equilibrio de Nash cercana en el escenario de juego mencionado, que utiliza información cinemática relativa en serie temporal y observación de obstáculos. Además, considerando la evitación de colisiones y el seguimiento cooperativo, se presentan varias técnicas, como funciones de recompensa novedosas y estructuras de redes recurrentes, para optimizar el proceso de entrenamiento. Los resultados de simulaciones numéricas demuestran que el método propuesto exhibe una capacidad de búsqueda superior para estrategias de Nash. Además, a través de experimentos virtuales dinámicos realizados con controladores de velocidad y actitud, se ha demostrado que los actores bien entrenados pueden actuar efectivamente como navegadores prácticos para el control de enjambres en tiempo real.