logo móvil
Contáctanos

Optimización de la trayectoria y descarga conjunta de computación para UAV de computación en la periferia: un algoritmo KNN-DDPG

Autores: Lu, Yiran; Xu, Chi; Wang, Yitian

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Optimización de la trayectoria y descarga conjunta de computación para UAV de computación en la periferia: un algoritmo KNN-DDPG


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Uav
Mecs
Descarga de computación
Planificación de trayectorias
Aprendizaje profundo por refuerzo
Vecino más cercano.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los vehículos aéreos no tripulados (VANT) se utilizan ampliamente para mejorar la cobertura y la calidad de comunicación de las redes inalámbricas y asistir en la computación en el borde móvil (MEC) debido a sus despliegues flexibles. Sin embargo, los sistemas MEC asistidos por VANT también enfrentan desafíos en términos de descarga de computación y planificación de trayectorias en un entorno dinámico. Este documento emplea el aprendizaje por refuerzo profundo para optimizar conjuntamente la descarga de computación y la planificación de trayectorias para el sistema MEC asistido por VANT. Específicamente, este documento investiga un escenario general donde múltiples dispositivos de usuario (UE) descargan tareas a un VANT equipado con un servidor MEC para colaborar en un trabajo complejo. Al considerar completamente el movimiento de los VANT y los UE, la proporción de descarga de computación y las relaciones bloqueadas, se formula un problema conjunto de descarga de computación y optimización de trayectorias para minimizar el retraso computacional máximo. Debido a la naturaleza no convexa del problema, se convierte en un proceso de decisión de Markov y se resuelve mediante el algoritmo de gradiente de política determinista profundo (DDPG). Para mejorar la capacidad de exploración y la estabilidad de DDPG, se emplea el algoritmo de K-vecinos más cercanos (KNN), denominado KNN-DDPG. Además, se utiliza el algoritmo de repetición de experiencia priorizada, donde la tasa de aprendizaje constante se reemplaza por una tasa de aprendizaje decreciente, para mejorar la convergencia. Para validar la efectividad y superioridad del algoritmo propuesto, KNN-DDPG se compara con el algoritmo de referencia DDPG. Los resultados de simulación demuestran que KNN-DDPG puede converger y lograr una reducción del 3.23% en el retraso en comparación con DDPG.

Otros recursos que podrían interesarte

Temas Virtualpro