Formación de Coaliciones Superpuestas para la Asignación de Recursos en Enjambres de UAV de Rescate Post-Desastre
Autores: Li, Wenxin; Feng, Yongxin; Zhou, Fan; Kostromitin, Konstantin Igorevich; Wang, Jian; Zhang, Peiying
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Formación de Coaliciones Superpuestas para la Asignación de Recursos en Enjambres de UAV de Rescate Post-Desastre
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículo aéreo no tripulado
Enjambres de UAV
Formación de coaliciones
Formación de coaliciones superpuestas
Compartición de recursos
Optimización combinatoria multiobjetivo.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los enjambres de vehículos aéreos no tripulados (UAV), equipados para la detección distribuida y la respuesta rápida, pueden formar coaliciones para llevar a cabo misiones complejas como el alivio post-desastre, el apoyo a la comunicación y la entrega de carga. Sin embargo, los métodos típicos de formación de coaliciones asignan cada UAV a una sola tarea, limitando el intercambio de recursos entre tareas. Para abordar esto, investigamos la formación de coaliciones superpuestas (OCF) para enjambres de UAV, donde se permite que un solo UAV participe en múltiples coaliciones, lo que permite la reutilización de recursos y reduce la inactividad. Formulamos OCF como un problema de optimización combinatoria multiobjetivo que equilibra conjuntamente la tasa de cumplimiento de tareas, la desviación de sincronización de coaliciones y el costo operativo, mientras que se tiene en cuenta explícitamente la contención de recursos entre coaliciones y la precedencia de ejecución. Específicamente, primero construimos una representación de hipergrafo de UAV y tareas y empleamos una red de atención de hipergrafo para capturar sus interacciones de alto orden. A continuación, proponemos un método de descomposición de valor jerárquico consciente de la estructura para el aprendizaje de políticas, que agrega progresivamente información a nivel individual y de coalición, modela la complementariedad de los miembros y las relaciones cooperativas-competitivas entre coaliciones, y genera una estimación de valor global que es sensible a los cambios en la estructura de la coalición. Además, integramos la Búsqueda de Árbol de Monte Carlo, utilizando el valor aprendido como una heurística para explorar de manera eficiente la región factible, y cerramos el ciclo con la reproducción de demostración de estructura candidata y la destilación de políticas, lo que permite que la búsqueda refine la política aprendida. En simulaciones de rescate a múltiples escalas, el enfoque propuesto mejora la utilidad de la tarea en hasta un 11.4% en comparación con la mejor línea base y aumenta la eficiencia energética en más del 228% en comparación con una variante de coalición no superpuesta.
Descripción
Los enjambres de vehículos aéreos no tripulados (UAV), equipados para la detección distribuida y la respuesta rápida, pueden formar coaliciones para llevar a cabo misiones complejas como el alivio post-desastre, el apoyo a la comunicación y la entrega de carga. Sin embargo, los métodos típicos de formación de coaliciones asignan cada UAV a una sola tarea, limitando el intercambio de recursos entre tareas. Para abordar esto, investigamos la formación de coaliciones superpuestas (OCF) para enjambres de UAV, donde se permite que un solo UAV participe en múltiples coaliciones, lo que permite la reutilización de recursos y reduce la inactividad. Formulamos OCF como un problema de optimización combinatoria multiobjetivo que equilibra conjuntamente la tasa de cumplimiento de tareas, la desviación de sincronización de coaliciones y el costo operativo, mientras que se tiene en cuenta explícitamente la contención de recursos entre coaliciones y la precedencia de ejecución. Específicamente, primero construimos una representación de hipergrafo de UAV y tareas y empleamos una red de atención de hipergrafo para capturar sus interacciones de alto orden. A continuación, proponemos un método de descomposición de valor jerárquico consciente de la estructura para el aprendizaje de políticas, que agrega progresivamente información a nivel individual y de coalición, modela la complementariedad de los miembros y las relaciones cooperativas-competitivas entre coaliciones, y genera una estimación de valor global que es sensible a los cambios en la estructura de la coalición. Además, integramos la Búsqueda de Árbol de Monte Carlo, utilizando el valor aprendido como una heurística para explorar de manera eficiente la región factible, y cerramos el ciclo con la reproducción de demostración de estructura candidata y la destilación de políticas, lo que permite que la búsqueda refine la política aprendida. En simulaciones de rescate a múltiples escalas, el enfoque propuesto mejora la utilidad de la tarea en hasta un 11.4% en comparación con la mejor línea base y aumenta la eficiencia energética en más del 228% en comparación con una variante de coalición no superpuesta.