Comunicación anti-jamming asistida por recolección de energía en enjambres de UAV basada en aprendizaje por refuerzo multi-agente
Autores: Li, Yongfang; Zhao, Tianyu; Wu, Zhijuan; Lin, Yan; Zhang, Yijin
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Comunicación anti-jamming asistida por recolección de energía en enjambres de UAV basada en aprendizaje por refuerzo multi-agente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículos aéreos no tripulados
Comunicación asistida por recolección de energía contra interferencias
Redes de enjambres de UAV
Proceso de decisión de Markov parcialmente observable y descentralizado
Actor-crítico independiente de ventaja multiagente
Correlaciones espaciotemporales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Considerando que los vehículos aéreos no tripulados (VANT) son susceptibles tanto a la interferencia en el mismo canal como a la interferencia maliciosa con energía limitada de batería a bordo, este documento propone un marco de comunicación asistido por recolección de energía para redes de enjambres de VANT. Específicamente, primero modelamos el problema como un proceso de decisión de Markov parcialmente observable descentralizado (Dec-POMDP), con el objetivo de lograr un equilibrio a largo plazo entre la tasa de éxito de transmisión de datos y el consumo de energía. Luego, proponemos una solución de comunicación asistida por recolección de energía basada en un actor-crítico de ventaja independiente (IA2C), que permite a cada cabeza de clúster (CH) aprender su canal de transmisión, potencia y política de tiempo de recolección de energía de manera independiente. Al construir un Dec-POMDP extendido basado en el tiempo y el espacio, se aprenden las correlaciones espaciotemporales entre nodos vecinos al permitir que agentes adyacentes compartan observaciones locales descontadas. Simulaciones extensas muestran que, en comparación con los esquemas de referencia, el esquema propuesto mejora la recompensa acumulativa promedio y la tasa de éxito acumulativa promedio en un 17.26% y un 10.37%, respectivamente, mientras logra una mayor tasa de éxito de transmisión con un menor consumo de energía bajo diferentes números de canales disponibles.
Descripción
Considerando que los vehículos aéreos no tripulados (VANT) son susceptibles tanto a la interferencia en el mismo canal como a la interferencia maliciosa con energía limitada de batería a bordo, este documento propone un marco de comunicación asistido por recolección de energía para redes de enjambres de VANT. Específicamente, primero modelamos el problema como un proceso de decisión de Markov parcialmente observable descentralizado (Dec-POMDP), con el objetivo de lograr un equilibrio a largo plazo entre la tasa de éxito de transmisión de datos y el consumo de energía. Luego, proponemos una solución de comunicación asistida por recolección de energía basada en un actor-crítico de ventaja independiente (IA2C), que permite a cada cabeza de clúster (CH) aprender su canal de transmisión, potencia y política de tiempo de recolección de energía de manera independiente. Al construir un Dec-POMDP extendido basado en el tiempo y el espacio, se aprenden las correlaciones espaciotemporales entre nodos vecinos al permitir que agentes adyacentes compartan observaciones locales descontadas. Simulaciones extensas muestran que, en comparación con los esquemas de referencia, el esquema propuesto mejora la recompensa acumulativa promedio y la tasa de éxito acumulativa promedio en un 17.26% y un 10.37%, respectivamente, mientras logra una mayor tasa de éxito de transmisión con un menor consumo de energía bajo diferentes números de canales disponibles.