logo móvil
Contáctanos

Programación Conjunta de Recursos del Intervalo de Tiempo, Potencia y Dirección del Lóbulo Principal en Redes Ad Hoc de UAV Direccionales: Un Enfoque de Aprendizaje por Refuerzo Profundo Multi-Agente

Autores: Liang, Shijie; Zhao, Haitao; Zhou, Li; Wang, Zhe; Cao, Kuo; Wang, Junfang

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Programación Conjunta de Recursos del Intervalo de Tiempo, Potencia y Dirección del Lóbulo Principal en Redes Ad Hoc de UAV Direccionales: Un Enfoque de Aprendizaje por Refuerzo Profundo Multi-Agente


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Direccional
Vehículo aéreo no tripulado
Redes ad hoc
Algoritmo de programación
Aprendizaje por refuerzo profundo multiagente
Dec-POMDP

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Las redes ad hoc de vehículos aéreos no tripulados (UAV) direccionales (DUANETs) se aplican ampliamente debido a su alta flexibilidad, fuerte capacidad de antiinterferencia y altas tasas de transmisión. Sin embargo, dentro de las redes direccionales, persiste una compleja interferencia mutua, lo que requiere la programación del intervalo de tiempo, la potencia y la dirección del lóbulo principal para todos los enlaces con el fin de mejorar el rendimiento de transmisión de los DUANETs. Para garantizar la equidad en la transmisión y el conteo total de paquetes de datos transmitidos para el DUANET bajo demandas dinámicas de transmisión de datos, se propone un algoritmo de programación para el intervalo de tiempo, la potencia y la dirección del lóbulo principal basado en el aprendizaje por refuerzo profundo de múltiples agentes (MADRL). Específicamente, se realiza un modelado con los enlaces como núcleo, optimizando las variables del intervalo de tiempo, la potencia y la dirección del lóbulo principal para el conteo de paquetes de datos transmitidos ponderado por la equidad. Se construye un proceso de decisión de Markov parcialmente observable descentralizado (Dec-POMDP) para el problema. Para procesar la observación en Dec-POMDP, se propone un método de procesamiento de observación basado en un mecanismo de atención para extraer características de observación de los UAV y sus vecinos dentro del rango del lóbulo principal, mejorando el rendimiento del algoritmo. Los algoritmos propuestos Dec-POMDP y MADRL permiten la toma de decisiones autónoma distribuida para la programación de recursos de intervalos de tiempo, potencia y direcciones del lóbulo principal. Finalmente, la simulación y el análisis se centran principalmente en el rendimiento del algoritmo propuesto y los algoritmos existentes a través de diversas tasas de generación de paquetes de datos, diferentes ganancias del lóbulo principal y diferentes anchos del lóbulo principal. Los resultados de la simulación muestran que el algoritmo MADRL basado en el mecanismo de atención mejora el rendimiento del algoritmo MADRL en un 22.17%. El algoritmo con la programación de la dirección del lóbulo principal mejora el rendimiento en un 67.06% en comparación con el algoritmo sin la programación de la dirección del lóbulo principal.

Otros recursos que podrían interesarte

Temas Virtualpro