logo móvil
Contáctanos

Enfoque de Seguimiento de Objetivos y Cercado Basado en Juegos de Potencial Estocástico para un Sistema de Múltiples Vehículos Aéreos No Tripulados

Autores: Yang, Kejie; Zhu, Ming; Guo, Xiao; Zhang, Yifei; Zhou, Yuting

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Enfoque de Seguimiento de Objetivos y Cercado Basado en Juegos de Potencial Estocástico para un Sistema de Múltiples Vehículos Aéreos No Tripulados


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Algoritmos de control inteligente distribuido
Vehículos aéreos no tripulados
Seguimiento de objetivos
Misiones de cerco
Marco de juego potencial estocástico
Aprendizaje por refuerzo multiagente

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La utilización de algoritmos de control inteligente totalmente distribuidos ha permitido la adopción gradual del sistema de múltiples vehículos aéreos no tripulados para ejecutar misiones de seguimiento y cercado de objetivos en aplicaciones industriales y civiles. Restringidos por el comportamiento de evasión del objetivo, los estudios actuales se centran en construir configuraciones de juegos de suma cero, y los solucionadores de estrategias existentes que acomodan espacios de estado-acción continuos han mostrado un rendimiento solo modesto. Para abordar los desafíos mencionados, diseñamos un marco de Juego Potencial Estocástico para modelar el escenario de la misión, considerando la limitada observabilidad del entorno. Además, se propone un método de aprendizaje por refuerzo multiagente para estimar la estrategia de equilibrio de Nash cercana en el escenario de juego mencionado, que utiliza información cinemática relativa en serie temporal y observación de obstáculos. Además, considerando la evitación de colisiones y el seguimiento cooperativo, se presentan varias técnicas, como funciones de recompensa novedosas y estructuras de redes recurrentes, para optimizar el proceso de entrenamiento. Los resultados de simulaciones numéricas demuestran que el método propuesto exhibe una capacidad de búsqueda superior para estrategias de Nash. Además, a través de experimentos virtuales dinámicos realizados con controladores de velocidad y actitud, se ha demostrado que los actores bien entrenados pueden actuar efectivamente como navegadores prácticos para el control de enjambres en tiempo real.

Otros recursos que podrían interesarte

Temas Virtualpro