Aprendizaje por refuerzo basado en optimización de trayectoria de doble UAV para comunicación segura
Autores: Qian, Zhouyi; Deng, Zhixiang; Cai, Changchun; Li, Haochen
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje por refuerzo basado en optimización de trayectoria de doble UAV para comunicación segura
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Vehículos aéreos no tripulados
Comunicación segura
Asistido por UAV
Oyentes
Tasas de secreto de capa física
Double-DQN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Los vehículos aéreos no tripulados (UAV) pueden servir como estaciones base aéreas para los usuarios debido a su flexibilidad, bajo costo y otras características. Sin embargo, debido a la alta posición de vuelo de los UAV, los canales aire-tierra (ATG) suelen dominar con línea de visión (LoS), lo que puede ser fácilmente interceptado por múltiples oyentes. Esto plantea un desafío para asegurar la comunicación entre los UAV y los usuarios terrestres. En este documento, estudiamos una comunicación segura asistida por UAV en un escenario urbano donde un UAV legítimo, llamado Alice, transmite información confidencial a un usuario legítimo, llamado Bob, en tierra en presencia de varios oyentes a su alrededor y un interferidor UAV envía ruido artificial para interferir con los oyentes. Nuestro objetivo es maximizar las tasas de secreto de capa física en el sistema optimizando conjuntamente las trayectorias de los UAV y su potencia de transmisión. Dado las características variables en el tiempo de los canales, este problema se modela como un proceso de decisión de Markov (MDP). En el documento se propone un algoritmo mejorado basado en double-DQN para resolver este problema de MDP. Los resultados de la simulación muestran que el algoritmo propuesto puede converger rápidamente bajo diferentes entornos, y que el transmisor UAV y los interferidores UAV pueden encontrar correctamente la ubicación óptima para maximizar la tasa de secreto de la información. También se muestra que el algoritmo basado en double-DQN (DDQN) funciona mejor que el aprendizaje Q y la red de aprendizaje profundo Q (DQN).
Descripción
Los vehículos aéreos no tripulados (UAV) pueden servir como estaciones base aéreas para los usuarios debido a su flexibilidad, bajo costo y otras características. Sin embargo, debido a la alta posición de vuelo de los UAV, los canales aire-tierra (ATG) suelen dominar con línea de visión (LoS), lo que puede ser fácilmente interceptado por múltiples oyentes. Esto plantea un desafío para asegurar la comunicación entre los UAV y los usuarios terrestres. En este documento, estudiamos una comunicación segura asistida por UAV en un escenario urbano donde un UAV legítimo, llamado Alice, transmite información confidencial a un usuario legítimo, llamado Bob, en tierra en presencia de varios oyentes a su alrededor y un interferidor UAV envía ruido artificial para interferir con los oyentes. Nuestro objetivo es maximizar las tasas de secreto de capa física en el sistema optimizando conjuntamente las trayectorias de los UAV y su potencia de transmisión. Dado las características variables en el tiempo de los canales, este problema se modela como un proceso de decisión de Markov (MDP). En el documento se propone un algoritmo mejorado basado en double-DQN para resolver este problema de MDP. Los resultados de la simulación muestran que el algoritmo propuesto puede converger rápidamente bajo diferentes entornos, y que el transmisor UAV y los interferidores UAV pueden encontrar correctamente la ubicación óptima para maximizar la tasa de secreto de la información. También se muestra que el algoritmo basado en double-DQN (DDQN) funciona mejor que el aprendizaje Q y la red de aprendizaje profundo Q (DQN).