Aprendizaje por refuerzo basado en optimización de trayectoria de doble UAV para comunicación segura

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Aprendizaje por refuerzo basado en optimización de trayectoria de doble UAV para comunicación segura

Autores: Qian, Zhouyi; Deng, Zhixiang; Cai, Changchun; Li, Haochen

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Aprendizaje por refuerzo basado en optimización de trayectoria de doble UAV para comunicación segura

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Vehículos aéreos no tripulados

Comunicación segura

Asistido por UAV

Oyentes

Tasas de secreto de capa física

Double-DQN

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones

Los vehículos aéreos no tripulados (UAV) pueden servir como estaciones base aéreas para los usuarios debido a su flexibilidad, bajo costo y otras características. Sin embargo, debido a la alta posición de vuelo de los UAV, los canales aire-tierra (ATG) suelen dominar con línea de visión (LoS), lo que puede ser fácilmente interceptado por múltiples oyentes. Esto plantea un desafío para asegurar la comunicación entre los UAV y los usuarios terrestres. En este documento, estudiamos una comunicación segura asistida por UAV en un escenario urbano donde un UAV legítimo, llamado Alice, transmite información confidencial a un usuario legítimo, llamado Bob, en tierra en presencia de varios oyentes a su alrededor y un interferidor UAV envía ruido artificial para interferir con los oyentes. Nuestro objetivo es maximizar las tasas de secreto de capa física en el sistema optimizando conjuntamente las trayectorias de los UAV y su potencia de transmisión. Dado las características variables en el tiempo de los canales, este problema se modela como un proceso de decisión de Markov (MDP). En el documento se propone un algoritmo mejorado basado en double-DQN para resolver este problema de MDP. Los resultados de la simulación muestran que el algoritmo propuesto puede converger rápidamente bajo diferentes entornos, y que el transmisor UAV y los interferidores UAV pueden encontrar correctamente la ubicación óptima para maximizar la tasa de secreto de la información. También se muestra que el algoritmo basado en double-DQN (DDQN) funciona mejor que el aprendizaje Q y la red de aprendizaje profundo Q (DQN).

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro