Comunicación Segura y Asignación de Recursos en Redes de UAV-MEC Asistidas por Doble-RIS
Autores: Hu, Xi; Zhao, Hongchao; He, Dongyang; Zhang, Wujie
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Comunicación Segura y Asignación de Recursos en Redes de UAV-MEC Asistidas por Doble-RIS
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Red inalámbrica urbana
Vehículo aéreo no tripulado
Computación en el borde móvil
Superficie inteligente reconfigurable
Optimización cooperativa
Transmisión segura
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En entornos urbanos inalámbricos complejos, los sistemas de computación en el borde móvil con vehículos aéreos no tripulados (UAV-MEC) enfrentan desafíos como el bloqueo de enlaces y las amenazas de espionaje con antenas únicas. La superficie inteligente reconfigurable (RIS) tradicional, limitada en colaboración, tiene dificultades para abordar estos problemas. Este documento propone un esquema de optimización cooperativa de UAV-MEC con doble RIS, aprovechando su reflexión conjunta para construir caminos de señal multidimensionales, aumentando las ganancias de enlace legítimas mientras suprime los canales de espionaje. Considera los cambios de fase de doble RIS, la potencia de transmisión del usuario en tierra (GU), las trayectorias de los UAV, la asignación de recursos y la formación de haces de recepción, con el objetivo de maximizar la eficiencia energética segura (EE) mientras se asegura la estabilidad a largo plazo de las colas de tareas de GU y UAV. Dadas las llegadas aleatorias de tareas y el acoplamiento de variables de alta dimensión, se construye un modelo dinámico que integra la estabilidad de la cola y las restricciones de transmisión segura utilizando optimización de Lyapunov, transformando la optimización estocástica a largo plazo en decisiones deterministas slot por slot a través del método de deriva más penalización. Para manejar espacios continuos de alta dimensión, se diseña un marco de optimización de políticas proximal de extremo a extremo (PPO) para el aprendizaje en línea de la asignación de recursos multidimensional y la adquisición directa de estrategias de optimización conjunta. Los resultados de simulación muestran que, en comparación con esquemas de referencia (por ejemplo, RIS único, RIS doble no cooperativo) y algoritmos de aprendizaje por refuerzo (por ejemplo, actor-crítico de ventaja (A2C), gradiente de política determinista profundo (DDPG), red Q profunda (DQN)), el esquema propuesto logra mejoras significativas en EE segura y estabilidad de colas, con una convergencia más rápida y mejores efectos de optimización, verificando completamente su superioridad y robustez en escenarios complejos.
Descripción
En entornos urbanos inalámbricos complejos, los sistemas de computación en el borde móvil con vehículos aéreos no tripulados (UAV-MEC) enfrentan desafíos como el bloqueo de enlaces y las amenazas de espionaje con antenas únicas. La superficie inteligente reconfigurable (RIS) tradicional, limitada en colaboración, tiene dificultades para abordar estos problemas. Este documento propone un esquema de optimización cooperativa de UAV-MEC con doble RIS, aprovechando su reflexión conjunta para construir caminos de señal multidimensionales, aumentando las ganancias de enlace legítimas mientras suprime los canales de espionaje. Considera los cambios de fase de doble RIS, la potencia de transmisión del usuario en tierra (GU), las trayectorias de los UAV, la asignación de recursos y la formación de haces de recepción, con el objetivo de maximizar la eficiencia energética segura (EE) mientras se asegura la estabilidad a largo plazo de las colas de tareas de GU y UAV. Dadas las llegadas aleatorias de tareas y el acoplamiento de variables de alta dimensión, se construye un modelo dinámico que integra la estabilidad de la cola y las restricciones de transmisión segura utilizando optimización de Lyapunov, transformando la optimización estocástica a largo plazo en decisiones deterministas slot por slot a través del método de deriva más penalización. Para manejar espacios continuos de alta dimensión, se diseña un marco de optimización de políticas proximal de extremo a extremo (PPO) para el aprendizaje en línea de la asignación de recursos multidimensional y la adquisición directa de estrategias de optimización conjunta. Los resultados de simulación muestran que, en comparación con esquemas de referencia (por ejemplo, RIS único, RIS doble no cooperativo) y algoritmos de aprendizaje por refuerzo (por ejemplo, actor-crítico de ventaja (A2C), gradiente de política determinista profundo (DDPG), red Q profunda (DQN)), el esquema propuesto logra mejoras significativas en EE segura y estabilidad de colas, con una convergencia más rápida y mejores efectos de optimización, verificando completamente su superioridad y robustez en escenarios complejos.