logo móvil
Contáctanos

Una Comparación de Algoritmos de Aprendizaje por Refuerzo en Programadores OFDMA Orientados a la Equidad

Autores: Coma, Ioan-Sorin; Zhang, Sijing; Aydin, Mehmet; Kuonen, Pierre; Trestian, Ramona; Ghinea, Gheorghi

Idioma: Inglés

Editor: MDPI

Año: 2019

Descargar PDF

Acceso abierto

Artículo científico
2019

Una Comparación de Algoritmos de Aprendizaje por Refuerzo en Programadores OFDMA Orientados a la Equidad


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Problemas de control a gran escala
Redes de acceso 5G
Gestión de recursos de radio
Aprendizaje por refuerzo
Programador de paquetes
Requisitos de equidad para los usuarios

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Debido a los problemas de control a gran escala en las redes de acceso 5G, se espera que la complejidad de la gestión de recursos radioeléctricos aumente significativamente. El aprendizaje por refuerzo se considera una solución prometedora que puede permitir la toma de decisiones inteligentes y reducir la complejidad de los diferentes problemas de optimización para la gestión de recursos radioeléctricos. El programador de paquetes es una entidad importante de la gestión de recursos radioeléctricos que asigna los paquetes de datos de los usuarios en el dominio de la frecuencia de acuerdo con la regla de programación implementada. En este contexto, al hacer uso del aprendizaje por refuerzo, podríamos determinar, en cada estado, la regla de programación más adecuada que se podría emplear para mejorar la calidad de la provisión del servicio. En este artículo, proponemos un marco basado en el aprendizaje por refuerzo para resolver problemas de programación con el enfoque principal en cumplir con los requisitos de equidad del usuario. Este marco utiliza redes neuronales de avance para mapear estados momentáneos a decisiones de parametrización adecuadas para el programador proporcionalmente justo. Los resultados de la simulación muestran que nuestro marco de aprendizaje por refuerzo supera a los programadores adaptativos convencionales orientados al objetivo de equidad. También se plantean discusiones para determinar el mejor algoritmo de aprendizaje por refuerzo que se debe implementar en el marco propuesto basado en varias configuraciones del programador.

Otros recursos que podrían interesarte

Temas Virtualpro