Comunicación anti-jamming asistida por recolección de energía en enjambres de UAV basada en aprendizaje por refuerzo multi-agente

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Comunicación anti-jamming asistida por recolección de energía en enjambres de UAV basada en aprendizaje por refuerzo multi-agente

Autores: Li, Yongfang; Zhao, Tianyu; Wu, Zhijuan; Lin, Yan; Zhang, Yijin

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico

2026

Comunicación anti-jamming asistida por recolección de energía en enjambres de UAV basada en aprendizaje por refuerzo multi-agente

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Vehículos aéreos no tripulados

Comunicación asistida por recolección de energía contra interferencias

Redes de enjambres de UAV

Proceso de decisión de Markov parcialmente observable y descentralizado

Actor-crítico independiente de ventaja multiagente

Correlaciones espaciotemporales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Considerando que los vehículos aéreos no tripulados (VANT) son susceptibles tanto a la interferencia en el mismo canal como a la interferencia maliciosa con energía limitada de batería a bordo, este documento propone un marco de comunicación asistido por recolección de energía para redes de enjambres de VANT. Específicamente, primero modelamos el problema como un proceso de decisión de Markov parcialmente observable descentralizado (Dec-POMDP), con el objetivo de lograr un equilibrio a largo plazo entre la tasa de éxito de transmisión de datos y el consumo de energía. Luego, proponemos una solución de comunicación asistida por recolección de energía basada en un actor-crítico de ventaja independiente (IA2C), que permite a cada cabeza de clúster (CH) aprender su canal de transmisión, potencia y política de tiempo de recolección de energía de manera independiente. Al construir un Dec-POMDP extendido basado en el tiempo y el espacio, se aprenden las correlaciones espaciotemporales entre nodos vecinos al permitir que agentes adyacentes compartan observaciones locales descontadas. Simulaciones extensas muestran que, en comparación con los esquemas de referencia, el esquema propuesto mejora la recompensa acumulativa promedio y la tasa de éxito acumulativa promedio en un 17.26% y un 10.37%, respectivamente, mientras logra una mayor tasa de éxito de transmisión con un menor consumo de energía bajo diferentes números de canales disponibles.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro