logo móvil
Contáctanos

Comunicación anti-jamming asistida por recolección de energía en enjambres de UAV basada en aprendizaje por refuerzo multi-agente

Autores: Li, Yongfang; Zhao, Tianyu; Wu, Zhijuan; Lin, Yan; Zhang, Yijin

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Comunicación anti-jamming asistida por recolección de energía en enjambres de UAV basada en aprendizaje por refuerzo multi-agente


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Vehículos aéreos no tripulados
Comunicación asistida por recolección de energía contra interferencias
Redes de enjambres de UAV
Proceso de decisión de Markov parcialmente observable y descentralizado
Actor-crítico independiente de ventaja multiagente
Correlaciones espaciotemporales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Considerando que los vehículos aéreos no tripulados (VANT) son susceptibles tanto a la interferencia en el mismo canal como a la interferencia maliciosa con energía limitada de batería a bordo, este documento propone un marco de comunicación asistido por recolección de energía para redes de enjambres de VANT. Específicamente, primero modelamos el problema como un proceso de decisión de Markov parcialmente observable descentralizado (Dec-POMDP), con el objetivo de lograr un equilibrio a largo plazo entre la tasa de éxito de transmisión de datos y el consumo de energía. Luego, proponemos una solución de comunicación asistida por recolección de energía basada en un actor-crítico de ventaja independiente (IA2C), que permite a cada cabeza de clúster (CH) aprender su canal de transmisión, potencia y política de tiempo de recolección de energía de manera independiente. Al construir un Dec-POMDP extendido basado en el tiempo y el espacio, se aprenden las correlaciones espaciotemporales entre nodos vecinos al permitir que agentes adyacentes compartan observaciones locales descontadas. Simulaciones extensas muestran que, en comparación con los esquemas de referencia, el esquema propuesto mejora la recompensa acumulativa promedio y la tasa de éxito acumulativa promedio en un 17.26% y un 10.37%, respectivamente, mientras logra una mayor tasa de éxito de transmisión con un menor consumo de energía bajo diferentes números de canales disponibles.

Otros recursos que podrían interesarte

Temas Virtualpro