Diseño de trayectoria basado en mapas de radio para red de comunicación de transmisión de energía inalámbrica asistida por UAV mediante aprendizaje profundo por refuerzo
Autores: Chen, Changhe; Wu, Fahui
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Diseño de trayectoria basado en mapas de radio para red de comunicación de transmisión de energía inalámbrica asistida por UAV mediante aprendizaje profundo por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Inalámbrico
Energía
VANT
Aprendizaje por refuerzo
Dispositivos de IoT
Red de comunicación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
En este documento, consideramos una red de comunicación inalámbrica que transporta energía de un UAV. En esta red de comunicación, los dispositivos de internet de las cosas (IoT) mantienen su funcionamiento a través de la alimentación de baterías. La energía de las baterías se consume lentamente con el tiempo. El UAV adopta el modo de trabajo full-duplex y el protocolo de vuelo estacionario, es decir, pueden alimentar al dispositivo objetivo en la posición de vuelo estacionario y recopilar datos de la estación base al mismo tiempo. A diferencia de los métodos tradicionales, que buscan lograr la transmisión de energía inalámbrica, este documento adopta el aprendizaje profundo por refuerzo. Por un lado, el algoritmo de aprendizaje profundo por refuerzo busca resolver el problema de programación dinámica sin un modelo. El método tradicional a menudo requiere un modelo de canal previo, para formar una fórmula sobre variables para la optimización convexa, mientras que el aprendizaje por refuerzo solo requiere la interacción entre agentes y el entorno. Luego, la estrategia se optimiza según la retroalimentación de la función de recompensa. Por otro lado, los métodos de optimización tradicionales generalmente resuelven problemas de programación estática. Dado que los dispositivos IoT recopilan constantemente información del entorno físico circundante y sus requisitos de alimentación cambian dinámicamente, los métodos tradicionales son relativamente complejos y requieren una gran carga computacional, mientras que el aprendizaje profundo por refuerzo se desempeña bien en problemas complejos. El propósito de nuestro trabajo es que con la asistencia del mapa de radio, un UAV pueda encontrar la mejor posición de vuelo estacionario, maximizar la energía suministrada por el UAV, maximizar el rendimiento de datos recopilados y minimizar el consumo de energía. Los resultados de la simulación muestran que el algoritmo propuesto puede encontrar bien la mejor posición de vuelo estacionario de los UAV y mejorar significativamente el rendimiento de la red de comunicación de transmisión de energía inalámbrica asistida por UAV.
Descripción
En este documento, consideramos una red de comunicación inalámbrica que transporta energía de un UAV. En esta red de comunicación, los dispositivos de internet de las cosas (IoT) mantienen su funcionamiento a través de la alimentación de baterías. La energía de las baterías se consume lentamente con el tiempo. El UAV adopta el modo de trabajo full-duplex y el protocolo de vuelo estacionario, es decir, pueden alimentar al dispositivo objetivo en la posición de vuelo estacionario y recopilar datos de la estación base al mismo tiempo. A diferencia de los métodos tradicionales, que buscan lograr la transmisión de energía inalámbrica, este documento adopta el aprendizaje profundo por refuerzo. Por un lado, el algoritmo de aprendizaje profundo por refuerzo busca resolver el problema de programación dinámica sin un modelo. El método tradicional a menudo requiere un modelo de canal previo, para formar una fórmula sobre variables para la optimización convexa, mientras que el aprendizaje por refuerzo solo requiere la interacción entre agentes y el entorno. Luego, la estrategia se optimiza según la retroalimentación de la función de recompensa. Por otro lado, los métodos de optimización tradicionales generalmente resuelven problemas de programación estática. Dado que los dispositivos IoT recopilan constantemente información del entorno físico circundante y sus requisitos de alimentación cambian dinámicamente, los métodos tradicionales son relativamente complejos y requieren una gran carga computacional, mientras que el aprendizaje profundo por refuerzo se desempeña bien en problemas complejos. El propósito de nuestro trabajo es que con la asistencia del mapa de radio, un UAV pueda encontrar la mejor posición de vuelo estacionario, maximizar la energía suministrada por el UAV, maximizar el rendimiento de datos recopilados y minimizar el consumo de energía. Los resultados de la simulación muestran que el algoritmo propuesto puede encontrar bien la mejor posición de vuelo estacionario de los UAV y mejorar significativamente el rendimiento de la red de comunicación de transmisión de energía inalámbrica asistida por UAV.