Predicción de Trayectorias y Optimización de Decisiones para Redes VEC Asistidas por UAV: Un Marco Integrado LSTM-TD3
Autores: Xie, Jiahao; Hao, Hao
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Predicción de Trayectorias y Optimización de Decisiones para Redes VEC Asistidas por UAV: Un Marco Integrado LSTM-TD3
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Sistemas de transporte inteligentes
Internet de las Cosas
Computación en el borde montada en vehículos
Red VEC asistida por UAV
Marco de aprendizaje por refuerzo profundo
Red LSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Con el rápido desarrollo de los sistemas de transporte inteligentes (ITS) y el Internet de las Cosas (IoT), las redes de computación en el borde montadas en vehículos (VEC) enfrentan el desafío de manejar tareas cada vez más intensivas en computación y sensibles a la latencia. En la red VEC asistida por UAV, al introducir servidores móviles en el borde, se complementa efectivamente la cobertura de la infraestructura terrestre. Sin embargo, aún existe el problema del retraso en la toma de decisiones en un entorno altamente dinámico. Este documento propone un marco de aprendizaje por refuerzo profundo basado en la red de memoria a corto y largo plazo (LSTM) para la predicción de trayectorias con el fin de optimizar la asignación de recursos en redes VEC asistidas por UAV. Integrando de manera única la predicción de trayectorias de vehículos con el algoritmo Twin Delayed Deep Deterministic Policy Gradient (TD3), este marco permite la descarga proactiva de computación y la planificación de trayectorias de UAV. Específicamente, diseñamos una red LSTM con un mecanismo de atención para predecir la futura trayectoria de los vehículos e integrar los resultados de la predicción en el proceso de toma de decisiones de optimización. Proponemos técnicas de suavizado de estado y aumento de datos para mejorar la estabilidad del entrenamiento y diseñamos un modelo de optimización multiobjetivo que incorpora la Edad de la Información (AoI), el consumo de energía y los costos de arrendamiento de recursos. Los resultados de la simulación muestran que, en comparación con los métodos existentes, el método propuesto en este documento reduce significativamente el costo total del sistema, mejora la frescura de la información y exhibe una mejor adaptabilidad ambiental y rendimiento de convergencia bajo diversas condiciones de red.
Descripción
Con el rápido desarrollo de los sistemas de transporte inteligentes (ITS) y el Internet de las Cosas (IoT), las redes de computación en el borde montadas en vehículos (VEC) enfrentan el desafío de manejar tareas cada vez más intensivas en computación y sensibles a la latencia. En la red VEC asistida por UAV, al introducir servidores móviles en el borde, se complementa efectivamente la cobertura de la infraestructura terrestre. Sin embargo, aún existe el problema del retraso en la toma de decisiones en un entorno altamente dinámico. Este documento propone un marco de aprendizaje por refuerzo profundo basado en la red de memoria a corto y largo plazo (LSTM) para la predicción de trayectorias con el fin de optimizar la asignación de recursos en redes VEC asistidas por UAV. Integrando de manera única la predicción de trayectorias de vehículos con el algoritmo Twin Delayed Deep Deterministic Policy Gradient (TD3), este marco permite la descarga proactiva de computación y la planificación de trayectorias de UAV. Específicamente, diseñamos una red LSTM con un mecanismo de atención para predecir la futura trayectoria de los vehículos e integrar los resultados de la predicción en el proceso de toma de decisiones de optimización. Proponemos técnicas de suavizado de estado y aumento de datos para mejorar la estabilidad del entrenamiento y diseñamos un modelo de optimización multiobjetivo que incorpora la Edad de la Información (AoI), el consumo de energía y los costos de arrendamiento de recursos. Los resultados de la simulación muestran que, en comparación con los métodos existentes, el método propuesto en este documento reduce significativamente el costo total del sistema, mejora la frescura de la información y exhibe una mejor adaptabilidad ambiental y rendimiento de convergencia bajo diversas condiciones de red.