Enfoque de Seguimiento de Objetivos y Cercado Basado en Juegos de Potencial Estocástico para un Sistema de Múltiples Vehículos Aéreos No Tripulados

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Enfoque de Seguimiento de Objetivos y Cercado Basado en Juegos de Potencial Estocástico para un Sistema de Múltiples Vehículos Aéreos No Tripulados

Autores: Yang, Kejie; Zhu, Ming; Guo, Xiao; Zhang, Yifei; Zhou, Yuting

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

Enfoque de Seguimiento de Objetivos y Cercado Basado en Juegos de Potencial Estocástico para un Sistema de Múltiples Vehículos Aéreos No Tripulados

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Algoritmos de control inteligente distribuido

Vehículos aéreos no tripulados

Seguimiento de objetivos

Misiones de cerco

Marco de juego potencial estocástico

Aprendizaje por refuerzo multiagente

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

La utilización de algoritmos de control inteligente totalmente distribuidos ha permitido la adopción gradual del sistema de múltiples vehículos aéreos no tripulados para ejecutar misiones de seguimiento y cercado de objetivos en aplicaciones industriales y civiles. Restringidos por el comportamiento de evasión del objetivo, los estudios actuales se centran en construir configuraciones de juegos de suma cero, y los solucionadores de estrategias existentes que acomodan espacios de estado-acción continuos han mostrado un rendimiento solo modesto. Para abordar los desafíos mencionados, diseñamos un marco de Juego Potencial Estocástico para modelar el escenario de la misión, considerando la limitada observabilidad del entorno. Además, se propone un método de aprendizaje por refuerzo multiagente para estimar la estrategia de equilibrio de Nash cercana en el escenario de juego mencionado, que utiliza información cinemática relativa en serie temporal y observación de obstáculos. Además, considerando la evitación de colisiones y el seguimiento cooperativo, se presentan varias técnicas, como funciones de recompensa novedosas y estructuras de redes recurrentes, para optimizar el proceso de entrenamiento. Los resultados de simulaciones numéricas demuestran que el método propuesto exhibe una capacidad de búsqueda superior para estrategias de Nash. Además, a través de experimentos virtuales dinámicos realizados con controladores de velocidad y actitud, se ha demostrado que los actores bien entrenados pueden actuar efectivamente como navegadores prácticos para el control de enjambres en tiempo real.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro