logo móvil
Contáctanos

Aprendizaje por refuerzo basado en optimización de trayectoria de doble UAV para comunicación segura

Autores: Qian, Zhouyi; Deng, Zhixiang; Cai, Changchun; Li, Haochen

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Aprendizaje por refuerzo basado en optimización de trayectoria de doble UAV para comunicación segura


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Vehículos aéreos no tripulados
Comunicación segura
Asistido por UAV
Oyentes
Tasas de secreto de capa física
Double-DQN

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones


Descripción
Los vehículos aéreos no tripulados (UAV) pueden servir como estaciones base aéreas para los usuarios debido a su flexibilidad, bajo costo y otras características. Sin embargo, debido a la alta posición de vuelo de los UAV, los canales aire-tierra (ATG) suelen dominar con línea de visión (LoS), lo que puede ser fácilmente interceptado por múltiples oyentes. Esto plantea un desafío para asegurar la comunicación entre los UAV y los usuarios terrestres. En este documento, estudiamos una comunicación segura asistida por UAV en un escenario urbano donde un UAV legítimo, llamado Alice, transmite información confidencial a un usuario legítimo, llamado Bob, en tierra en presencia de varios oyentes a su alrededor y un interferidor UAV envía ruido artificial para interferir con los oyentes. Nuestro objetivo es maximizar las tasas de secreto de capa física en el sistema optimizando conjuntamente las trayectorias de los UAV y su potencia de transmisión. Dado las características variables en el tiempo de los canales, este problema se modela como un proceso de decisión de Markov (MDP). En el documento se propone un algoritmo mejorado basado en double-DQN para resolver este problema de MDP. Los resultados de la simulación muestran que el algoritmo propuesto puede converger rápidamente bajo diferentes entornos, y que el transmisor UAV y los interferidores UAV pueden encontrar correctamente la ubicación óptima para maximizar la tasa de secreto de la información. También se muestra que el algoritmo basado en double-DQN (DDQN) funciona mejor que el aprendizaje Q y la red de aprendizaje profundo Q (DQN).

Otros recursos que podrían interesarte

Temas Virtualpro