Un Método de Asignación de Tareas Generativas para Enjambres de UAV Heterogéneos Potenciado por Cadenas de Herramientas Heterogéneas
Autores: Ai, Lei; Ma, Bin; Zhang, Jianxing; Ai, Yao; Hao, Ziqi; Li, Jianan; Yu, Zhuting; Cheng, Jiayu
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un Método de Asignación de Tareas Generativas para Enjambres de UAV Heterogéneos Potenciado por Cadenas de Herramientas Heterogéneas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Asignación de tareas
Enjambres heterogéneos de vehículos aéreos no tripulados (UAV)
Paradigma generativo
Arquitectura de doble modelo
Método de entrenamiento evolutivo
Algoritmo de sonda causal recursiva (RCP)
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La asignación de tareas para enjambres de vehículos aéreos no tripulados (UAV) heterogéneos requiere una coordinación espaciotemporal compleja. Mientras que los algoritmos tradicionales luchan por interpretar intenciones semánticas abstractas, los modelos de lenguaje grandes (LLMs) generales a menudo sufren de alucinaciones físicas y razonamiento táctico superficial. Para abordar estas limitaciones, proponemos un paradigma de asignación de tareas generativas aumentado por una cadena de herramientas heterogénea, cambiando el enfoque de la optimización numérica rígida hacia la planificación semántica fundamentada en herramientas. Para implementar esto y superar la escasez de datos en el dominio, diseñamos una arquitectura de modelo dual desacoplada. Esta arquitectura se optimiza a través de un método de entrenamiento de evolución ortogonal anclado en un manifold de ejecución. Al utilizar el auto-juego simulado dentro de un entorno de ejecución estable, este enfoque previene conflictos de gradiente y genera de manera autónoma abundantes datos de entrenamiento. Además, para resolver el problema de asignación de crédito en escenarios de largo horizonte, desarrollamos un algoritmo de Sonda Causal Recursiva (RCP). Al rastrear fallos hacia atrás a través de la simulación, RCP sintetiza datos de preferencias contrafactuales, traduciendo efectivamente errores tácticos en correcciones precisas para el modelo de planificación. Simulaciones extensas demuestran que nuestro método logra una tasa de éxito de misión del 82.34% en escenarios complejos, requiriendo significativamente menos correcciones interactivas que los LLMs generales, verificando completamente su viabilidad física y robustez práctica.
Descripción
La asignación de tareas para enjambres de vehículos aéreos no tripulados (UAV) heterogéneos requiere una coordinación espaciotemporal compleja. Mientras que los algoritmos tradicionales luchan por interpretar intenciones semánticas abstractas, los modelos de lenguaje grandes (LLMs) generales a menudo sufren de alucinaciones físicas y razonamiento táctico superficial. Para abordar estas limitaciones, proponemos un paradigma de asignación de tareas generativas aumentado por una cadena de herramientas heterogénea, cambiando el enfoque de la optimización numérica rígida hacia la planificación semántica fundamentada en herramientas. Para implementar esto y superar la escasez de datos en el dominio, diseñamos una arquitectura de modelo dual desacoplada. Esta arquitectura se optimiza a través de un método de entrenamiento de evolución ortogonal anclado en un manifold de ejecución. Al utilizar el auto-juego simulado dentro de un entorno de ejecución estable, este enfoque previene conflictos de gradiente y genera de manera autónoma abundantes datos de entrenamiento. Además, para resolver el problema de asignación de crédito en escenarios de largo horizonte, desarrollamos un algoritmo de Sonda Causal Recursiva (RCP). Al rastrear fallos hacia atrás a través de la simulación, RCP sintetiza datos de preferencias contrafactuales, traduciendo efectivamente errores tácticos en correcciones precisas para el modelo de planificación. Simulaciones extensas demuestran que nuestro método logra una tasa de éxito de misión del 82.34% en escenarios complejos, requiriendo significativamente menos correcciones interactivas que los LLMs generales, verificando completamente su viabilidad física y robustez práctica.