CaST-MASAC: Integrando Inferencia Causal y Atención Espacio-Temporal para la Planificación de Tareas Cooperativas Multi-UAV
Autores: Chen, Renjie; Hu, Feng
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
CaST-MASAC: Integrando Inferencia Causal y Atención Espacio-Temporal para la Planificación de Tareas Cooperativas Multi-UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Eficiente
Coordinación
Vehículo aéreo no tripulado múltiple
Atención espaciotemporal
Experiencia de repetición de inferencia causal
Estrategias de coordinación multiagente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La coordinación eficiente de sistemas de vehículos aéreos no tripulados (UAV) en el cada vez más complejo dominio de las tareas aéreas se ve obstaculizada por desafíos significativos, incluyendo la observabilidad parcial, la baja eficiencia de muestreo y las dificultades en la coordinación entre agentes. Para abordar estos problemas, este documento presenta un nuevo marco de Crítica Suave Multi-Agente Espacio-Temporal Causal (CaST-MASAC). En su núcleo, CaST-MASAC integra dos innovaciones clave: (1) un módulo de atención espacio-temporal (STa) que extrae características de observaciones históricas para permitir una predicción precisa de la trayectoria del objetivo y una asignación dinámica de tareas, mejorando así la conciencia situacional y la toma de decisiones colaborativa en entornos altamente dinámicos y parcialmente observables; y (2) un mecanismo de Repetición de Experiencia de Inferencia Causal (CIER) que mejora significativamente la eficiencia de muestreo y la velocidad de convergencia al identificar y priorizar experiencias con un alto impacto causal en el éxito de la tarea. Evaluado en entornos de simulación de coordinación aérea multi-UAV 4v4 y 2v2, CaST-MASAC demuestra un rendimiento superior en comparación con las líneas base de última generación como MAPPO y QMIX en términos de tasa de éxito de la tarea, recompensa acumulativa y eficiencia en la toma de decisiones. Además, estudios de ablación extensivos validan las contribuciones críticas de los módulos STa y CIER al rendimiento general del marco. En consecuencia, CaST-MASAC ofrece un enfoque novedoso y efectivo para desarrollar estrategias de coordinación multi-agente robustas y eficientes en entornos dinámicos complejos.
Descripción
La coordinación eficiente de sistemas de vehículos aéreos no tripulados (UAV) en el cada vez más complejo dominio de las tareas aéreas se ve obstaculizada por desafíos significativos, incluyendo la observabilidad parcial, la baja eficiencia de muestreo y las dificultades en la coordinación entre agentes. Para abordar estos problemas, este documento presenta un nuevo marco de Crítica Suave Multi-Agente Espacio-Temporal Causal (CaST-MASAC). En su núcleo, CaST-MASAC integra dos innovaciones clave: (1) un módulo de atención espacio-temporal (STa) que extrae características de observaciones históricas para permitir una predicción precisa de la trayectoria del objetivo y una asignación dinámica de tareas, mejorando así la conciencia situacional y la toma de decisiones colaborativa en entornos altamente dinámicos y parcialmente observables; y (2) un mecanismo de Repetición de Experiencia de Inferencia Causal (CIER) que mejora significativamente la eficiencia de muestreo y la velocidad de convergencia al identificar y priorizar experiencias con un alto impacto causal en el éxito de la tarea. Evaluado en entornos de simulación de coordinación aérea multi-UAV 4v4 y 2v2, CaST-MASAC demuestra un rendimiento superior en comparación con las líneas base de última generación como MAPPO y QMIX en términos de tasa de éxito de la tarea, recompensa acumulativa y eficiencia en la toma de decisiones. Además, estudios de ablación extensivos validan las contribuciones críticas de los módulos STa y CIER al rendimiento general del marco. En consecuencia, CaST-MASAC ofrece un enfoque novedoso y efectivo para desarrollar estrategias de coordinación multi-agente robustas y eficientes en entornos dinámicos complejos.