Optimización de la trayectoria y descarga conjunta de computación para UAV de computación en la periferia: un algoritmo KNN-DDPG
Autores: Lu, Yiran; Xu, Chi; Wang, Yitian
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Optimización de la trayectoria y descarga conjunta de computación para UAV de computación en la periferia: un algoritmo KNN-DDPG
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Uav
Mecs
Descarga de computación
Planificación de trayectorias
Aprendizaje profundo por refuerzo
Vecino más cercano.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los vehículos aéreos no tripulados (VANT) se utilizan ampliamente para mejorar la cobertura y la calidad de comunicación de las redes inalámbricas y asistir en la computación en el borde móvil (MEC) debido a sus despliegues flexibles. Sin embargo, los sistemas MEC asistidos por VANT también enfrentan desafíos en términos de descarga de computación y planificación de trayectorias en un entorno dinámico. Este documento emplea el aprendizaje por refuerzo profundo para optimizar conjuntamente la descarga de computación y la planificación de trayectorias para el sistema MEC asistido por VANT. Específicamente, este documento investiga un escenario general donde múltiples dispositivos de usuario (UE) descargan tareas a un VANT equipado con un servidor MEC para colaborar en un trabajo complejo. Al considerar completamente el movimiento de los VANT y los UE, la proporción de descarga de computación y las relaciones bloqueadas, se formula un problema conjunto de descarga de computación y optimización de trayectorias para minimizar el retraso computacional máximo. Debido a la naturaleza no convexa del problema, se convierte en un proceso de decisión de Markov y se resuelve mediante el algoritmo de gradiente de política determinista profundo (DDPG). Para mejorar la capacidad de exploración y la estabilidad de DDPG, se emplea el algoritmo de K-vecinos más cercanos (KNN), denominado KNN-DDPG. Además, se utiliza el algoritmo de repetición de experiencia priorizada, donde la tasa de aprendizaje constante se reemplaza por una tasa de aprendizaje decreciente, para mejorar la convergencia. Para validar la efectividad y superioridad del algoritmo propuesto, KNN-DDPG se compara con el algoritmo de referencia DDPG. Los resultados de simulación demuestran que KNN-DDPG puede converger y lograr una reducción del 3.23% en el retraso en comparación con DDPG.
Descripción
Los vehículos aéreos no tripulados (VANT) se utilizan ampliamente para mejorar la cobertura y la calidad de comunicación de las redes inalámbricas y asistir en la computación en el borde móvil (MEC) debido a sus despliegues flexibles. Sin embargo, los sistemas MEC asistidos por VANT también enfrentan desafíos en términos de descarga de computación y planificación de trayectorias en un entorno dinámico. Este documento emplea el aprendizaje por refuerzo profundo para optimizar conjuntamente la descarga de computación y la planificación de trayectorias para el sistema MEC asistido por VANT. Específicamente, este documento investiga un escenario general donde múltiples dispositivos de usuario (UE) descargan tareas a un VANT equipado con un servidor MEC para colaborar en un trabajo complejo. Al considerar completamente el movimiento de los VANT y los UE, la proporción de descarga de computación y las relaciones bloqueadas, se formula un problema conjunto de descarga de computación y optimización de trayectorias para minimizar el retraso computacional máximo. Debido a la naturaleza no convexa del problema, se convierte en un proceso de decisión de Markov y se resuelve mediante el algoritmo de gradiente de política determinista profundo (DDPG). Para mejorar la capacidad de exploración y la estabilidad de DDPG, se emplea el algoritmo de K-vecinos más cercanos (KNN), denominado KNN-DDPG. Además, se utiliza el algoritmo de repetición de experiencia priorizada, donde la tasa de aprendizaje constante se reemplaza por una tasa de aprendizaje decreciente, para mejorar la convergencia. Para validar la efectividad y superioridad del algoritmo propuesto, KNN-DDPG se compara con el algoritmo de referencia DDPG. Los resultados de simulación demuestran que KNN-DDPG puede converger y lograr una reducción del 3.23% en el retraso en comparación con DDPG.