Optimización de política del algoritmo de asignación de potencia basado en el marco Actor-Crítico en redes de celdas pequeñas

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Optimización de política del algoritmo de asignación de potencia basado en el marco Actor-Crítico en redes de celdas pequeñas

Autores: Chen, Haibo; Huang, Zhongwei; Zhao, Xiaorong; Liu, Xiao; Jiang, Youjun; Geng, Pinyong; Yang, Guang; Cao, Yewen; Wang, Deqiang

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Optimización de política del algoritmo de asignación de potencia basado en el marco Actor-Crítico en redes de celdas pequeñas

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Solución

Problema de asignación de potencia

Redes de celdas pequeñas ultra densas

Aprendizaje profundo por refuerzo

Marco actor-crítico

Optimización de políticas

POPA

Optimización de políticas proximales

Algoritmo PPO

Simulaciones

Eficiencia espectral

Valor práctico

Escalabilidad

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones

Una solución práctica al problema de asignación de potencia en redes de celdas pequeñas ultra densas se puede lograr utilizando métodos de aprendizaje profundo por refuerzo (DRL). A diferencia de los algoritmos tradicionales, los métodos de DRL son capaces de lograr baja latencia y operar sin la necesidad de información global en tiempo real del estado del canal (CSI). Basándonos en el marco de trabajo de actor-crítico, proponemos una optimización de política del algoritmo de asignación de potencia (POPA) para redes de celdas pequeñas en este artículo. El POPA adopta el algoritmo de optimización de política proximal (PPO) para actualizar la política, lo que ha demostrado tener efectos estables de exploración y convergencia en nuestras simulaciones. Gracias a nuestra arquitectura propuesta de actor-crítico con ejecución distribuida y entrenamiento de exploración centralizado, el POPA puede cumplir con los requisitos en tiempo real y tiene escalabilidad multidimensional. A través de simulaciones, demostramos que el POPA supera a los métodos existentes en cuanto a eficiencia espectral. Nuestros hallazgos sugieren que el POPA puede tener un valor práctico para la asignación de potencia en redes de celdas pequeñas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro