Una Comparación de Algoritmos de Aprendizaje por Refuerzo en Programadores OFDMA Orientados a la Equidad

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Una Comparación de Algoritmos de Aprendizaje por Refuerzo en Programadores OFDMA Orientados a la Equidad

Autores: Coma, Ioan-Sorin; Zhang, Sijing; Aydin, Mehmet; Kuonen, Pierre; Trestian, Ramona; Ghinea, Gheorghi

Idioma: Inglés

Editor: MDPI

Año: 2019

Descargar PDF

Acceso abierto

Artículo científico

2019

Una Comparación de Algoritmos de Aprendizaje por Refuerzo en Programadores OFDMA Orientados a la Equidad

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Problemas de control a gran escala

Redes de acceso 5G

Gestión de recursos de radio

Aprendizaje por refuerzo

Programador de paquetes

Requisitos de equidad para los usuarios

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

Debido a los problemas de control a gran escala en las redes de acceso 5G, se espera que la complejidad de la gestión de recursos radioeléctricos aumente significativamente. El aprendizaje por refuerzo se considera una solución prometedora que puede permitir la toma de decisiones inteligentes y reducir la complejidad de los diferentes problemas de optimización para la gestión de recursos radioeléctricos. El programador de paquetes es una entidad importante de la gestión de recursos radioeléctricos que asigna los paquetes de datos de los usuarios en el dominio de la frecuencia de acuerdo con la regla de programación implementada. En este contexto, al hacer uso del aprendizaje por refuerzo, podríamos determinar, en cada estado, la regla de programación más adecuada que se podría emplear para mejorar la calidad de la provisión del servicio. En este artículo, proponemos un marco basado en el aprendizaje por refuerzo para resolver problemas de programación con el enfoque principal en cumplir con los requisitos de equidad del usuario. Este marco utiliza redes neuronales de avance para mapear estados momentáneos a decisiones de parametrización adecuadas para el programador proporcionalmente justo. Los resultados de la simulación muestran que nuestro marco de aprendizaje por refuerzo supera a los programadores adaptativos convencionales orientados al objetivo de equidad. También se plantean discusiones para determinar el mejor algoritmo de aprendizaje por refuerzo que se debe implementar en el marco propuesto basado en varias configuraciones del programador.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro