Atención de Gráficos Constrainada DRL para la Descarga Conjunta de Tareas y Asignación de Recursos en Vehículos de Internet Asistidos por UAV
Autores: Zhang, Peiying; Zheng, Xiangguo; Kostromitin, Konstantin Igorevich; Zhang, Wei; Shi, Huiling; Tan, Lizhuang
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Atención de Gráficos Constrainada DRL para la Descarga Conjunta de Tareas y Asignación de Recursos en Vehículos de Internet Asistidos por UAV
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículos aéreos no tripulados
IoV
Descarga de tareas
Asignación de recursos
Asistido por UAV
Computación en el borde
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los vehículos aéreos no tripulados (VANT) que actúan como plataformas móviles aéreas pueden ofrecer comunicación y computación bajo demanda para el Internet de los Vehículos (IoV) a través de un despliegue flexible y enlaces de línea de vista (LoS), mejorando la fiabilidad y reduciendo la latencia. Sin embargo, la alta movilidad de los vehículos, los canales que varían con el tiempo y la energía limitada a bordo hacen que la descarga de tareas y la coordinación de recursos sean un desafío. Este documento estudia la descarga conjunta de tareas y la asignación de recursos en un sistema IoV asistido por VANT, donde el VANT selecciona su posición de suspensión de sitios candidatos discretos en cada intervalo de tiempo y divide las tareas vehiculares entre el VANT y una unidad de carretera (RSU) para aliviar la congestión de la conexión de retorno y mejorar la utilización de los recursos en el borde. Considerando la movilidad de los vehículos, la dinámica de colas en múltiples etapas y el consumo de energía del VANT para la comunicación, la computación y el movimiento, la optimización en línea de la selección de posición, la división de tareas y la asignación de ancho de banda se formula como un proceso de decisión de Markov restringido (CMDP). El objetivo es maximizar el número de tareas completadas dentro de los plazos de latencia mientras se satisface el presupuesto de energía del VANT. Para resolver este CMDP, proponemos un algoritmo de gradiente de política determinista retrasado de doble crítico basado en atención gráfica (GAT-CTD3). Una red de atención gráfica captura correlaciones espaciales y competencia por recursos entre vehículos activos, mientras que un marco TD3 lagrangiano impone restricciones de energía a largo plazo y mejora la estabilidad del aprendizaje a través de críticos dobles, actualizaciones de políticas retrasadas y suavizado de objetivos. Los resultados de la simulación demuestran que supera el esquema comparativo en términos de tasa de finalización de tareas, retraso y consumo de energía por tarea completada, y exhibe una fuerte robustez en situaciones de tráfico denso.
Descripción
Los vehículos aéreos no tripulados (VANT) que actúan como plataformas móviles aéreas pueden ofrecer comunicación y computación bajo demanda para el Internet de los Vehículos (IoV) a través de un despliegue flexible y enlaces de línea de vista (LoS), mejorando la fiabilidad y reduciendo la latencia. Sin embargo, la alta movilidad de los vehículos, los canales que varían con el tiempo y la energía limitada a bordo hacen que la descarga de tareas y la coordinación de recursos sean un desafío. Este documento estudia la descarga conjunta de tareas y la asignación de recursos en un sistema IoV asistido por VANT, donde el VANT selecciona su posición de suspensión de sitios candidatos discretos en cada intervalo de tiempo y divide las tareas vehiculares entre el VANT y una unidad de carretera (RSU) para aliviar la congestión de la conexión de retorno y mejorar la utilización de los recursos en el borde. Considerando la movilidad de los vehículos, la dinámica de colas en múltiples etapas y el consumo de energía del VANT para la comunicación, la computación y el movimiento, la optimización en línea de la selección de posición, la división de tareas y la asignación de ancho de banda se formula como un proceso de decisión de Markov restringido (CMDP). El objetivo es maximizar el número de tareas completadas dentro de los plazos de latencia mientras se satisface el presupuesto de energía del VANT. Para resolver este CMDP, proponemos un algoritmo de gradiente de política determinista retrasado de doble crítico basado en atención gráfica (GAT-CTD3). Una red de atención gráfica captura correlaciones espaciales y competencia por recursos entre vehículos activos, mientras que un marco TD3 lagrangiano impone restricciones de energía a largo plazo y mejora la estabilidad del aprendizaje a través de críticos dobles, actualizaciones de políticas retrasadas y suavizado de objetivos. Los resultados de la simulación demuestran que supera el esquema comparativo en términos de tasa de finalización de tareas, retraso y consumo de energía por tarea completada, y exhibe una fuerte robustez en situaciones de tráfico denso.