MA-JTATO: Asociación de Tareas Conjuntas de Múltiples Agentes y Optimización de Trayectorias en un Sistema de Computación en el Borde Asistido por UAV
Autores: Zhang, Yunxi; Wen, Zhigang
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
MA-JTATO: Asociación de Tareas Conjuntas de Múltiples Agentes y Optimización de Trayectorias en un Sistema de Computación en el Borde Asistido por UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Desarrollo rápido
Computación en el borde
Asistido por UAV
Marco de optimización
Optimización de QoS
Algoritmo multiagente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Con el rápido desarrollo de aplicaciones como las ciudades inteligentes y el internet industrial, las tareas intensivas en computación generadas por dispositivos de sensado masivo presentan desafíos significativos para los paradigmas tradicionales de computación en la nube. Los sistemas de computación en el borde asistidos por vehículos aéreos no tripulados (VANT), aprovechando su alta movilidad y capacidades de cobertura de amplia área, ofrecen una arquitectura innovadora para servicios en el borde de baja latencia y alta fiabilidad. Sin embargo, el despliegue práctico de tales sistemas enfrenta un problema de optimización multiobjetivo altamente complejo caracterizado por el estrecho acoplamiento de decisiones de descarga de tareas, planificación de trayectorias de VANT y asignación de recursos de servidores en el borde. Los métodos de optimización convencionales son difíciles de adaptar a las características dinámicas y de alta dimensión de este problema, lo que lleva a un rendimiento subóptimo del sistema. Para abordar este desafío crítico, este documento construye un marco de optimización colaborativa inteligente para sistemas de computación en el borde asistidos por VANT y formula el problema de optimización de la calidad del servicio (QoS) del sistema como un problema de programación no convexa de enteros mixtos con los objetivos duales de minimizar la latencia de procesamiento de tareas y reducir el consumo total de energía del sistema. Se propone un algoritmo de asociación de tareas conjunta y optimización de trayectorias de múltiples agentes (MA-JTATO) basado en aprendizaje por refuerzo híbrido para resolver este problema intratable, que desacopla de manera innovadora el problema de optimización acoplado original en tres subproblemas interrelacionados y realiza su solución colaborativa y eficiente. Específicamente, se adopta el algoritmo Advantage Actor-Critic (A2C) para realizar una asociación de tareas dinámica y óptima entre VANT y servidores en el borde para requisitos de toma de decisiones discretas; se emplea el método de gradiente de política determinista profunda de múltiples agentes (MADDPG) para lograr una planificación de trayectorias cooperativa y eficiente en energía para múltiples VANT para satisfacer las necesidades de control continuo en entornos dinámicos; y se aplica la teoría de optimización convexa para obtener una solución óptima en forma cerrada para la asignación eficiente de recursos computacionales en servidores en el borde. Los resultados de simulación demuestran que el algoritmo MA-JTATO propuesto supera significativamente a los algoritmos de referencia tradicionales en la mejora de la QoS general, validando efectivamente el rendimiento superior y la robustez del marco en escenarios dinámicos y complejos.
Descripción
Con el rápido desarrollo de aplicaciones como las ciudades inteligentes y el internet industrial, las tareas intensivas en computación generadas por dispositivos de sensado masivo presentan desafíos significativos para los paradigmas tradicionales de computación en la nube. Los sistemas de computación en el borde asistidos por vehículos aéreos no tripulados (VANT), aprovechando su alta movilidad y capacidades de cobertura de amplia área, ofrecen una arquitectura innovadora para servicios en el borde de baja latencia y alta fiabilidad. Sin embargo, el despliegue práctico de tales sistemas enfrenta un problema de optimización multiobjetivo altamente complejo caracterizado por el estrecho acoplamiento de decisiones de descarga de tareas, planificación de trayectorias de VANT y asignación de recursos de servidores en el borde. Los métodos de optimización convencionales son difíciles de adaptar a las características dinámicas y de alta dimensión de este problema, lo que lleva a un rendimiento subóptimo del sistema. Para abordar este desafío crítico, este documento construye un marco de optimización colaborativa inteligente para sistemas de computación en el borde asistidos por VANT y formula el problema de optimización de la calidad del servicio (QoS) del sistema como un problema de programación no convexa de enteros mixtos con los objetivos duales de minimizar la latencia de procesamiento de tareas y reducir el consumo total de energía del sistema. Se propone un algoritmo de asociación de tareas conjunta y optimización de trayectorias de múltiples agentes (MA-JTATO) basado en aprendizaje por refuerzo híbrido para resolver este problema intratable, que desacopla de manera innovadora el problema de optimización acoplado original en tres subproblemas interrelacionados y realiza su solución colaborativa y eficiente. Específicamente, se adopta el algoritmo Advantage Actor-Critic (A2C) para realizar una asociación de tareas dinámica y óptima entre VANT y servidores en el borde para requisitos de toma de decisiones discretas; se emplea el método de gradiente de política determinista profunda de múltiples agentes (MADDPG) para lograr una planificación de trayectorias cooperativa y eficiente en energía para múltiples VANT para satisfacer las necesidades de control continuo en entornos dinámicos; y se aplica la teoría de optimización convexa para obtener una solución óptima en forma cerrada para la asignación eficiente de recursos computacionales en servidores en el borde. Los resultados de simulación demuestran que el algoritmo MA-JTATO propuesto supera significativamente a los algoritmos de referencia tradicionales en la mejora de la QoS general, validando efectivamente el rendimiento superior y la robustez del marco en escenarios dinámicos y complejos.