Una Comparación de Algoritmos de Aprendizaje por Refuerzo en Programadores OFDMA Orientados a la Equidad
Autores: Coma, Ioan-Sorin; Zhang, Sijing; Aydin, Mehmet; Kuonen, Pierre; Trestian, Ramona; Ghinea, Gheorghi
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Una Comparación de Algoritmos de Aprendizaje por Refuerzo en Programadores OFDMA Orientados a la Equidad
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Problemas de control a gran escala
Redes de acceso 5G
Gestión de recursos de radio
Aprendizaje por refuerzo
Programador de paquetes
Requisitos de equidad para los usuarios
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Debido a los problemas de control a gran escala en las redes de acceso 5G, se espera que la complejidad de la gestión de recursos radioeléctricos aumente significativamente. El aprendizaje por refuerzo se considera una solución prometedora que puede permitir la toma de decisiones inteligentes y reducir la complejidad de los diferentes problemas de optimización para la gestión de recursos radioeléctricos. El programador de paquetes es una entidad importante de la gestión de recursos radioeléctricos que asigna los paquetes de datos de los usuarios en el dominio de la frecuencia de acuerdo con la regla de programación implementada. En este contexto, al hacer uso del aprendizaje por refuerzo, podríamos determinar, en cada estado, la regla de programación más adecuada que se podría emplear para mejorar la calidad de la provisión del servicio. En este artículo, proponemos un marco basado en el aprendizaje por refuerzo para resolver problemas de programación con el enfoque principal en cumplir con los requisitos de equidad del usuario. Este marco utiliza redes neuronales de avance para mapear estados momentáneos a decisiones de parametrización adecuadas para el programador proporcionalmente justo. Los resultados de la simulación muestran que nuestro marco de aprendizaje por refuerzo supera a los programadores adaptativos convencionales orientados al objetivo de equidad. También se plantean discusiones para determinar el mejor algoritmo de aprendizaje por refuerzo que se debe implementar en el marco propuesto basado en varias configuraciones del programador.
Descripción
Debido a los problemas de control a gran escala en las redes de acceso 5G, se espera que la complejidad de la gestión de recursos radioeléctricos aumente significativamente. El aprendizaje por refuerzo se considera una solución prometedora que puede permitir la toma de decisiones inteligentes y reducir la complejidad de los diferentes problemas de optimización para la gestión de recursos radioeléctricos. El programador de paquetes es una entidad importante de la gestión de recursos radioeléctricos que asigna los paquetes de datos de los usuarios en el dominio de la frecuencia de acuerdo con la regla de programación implementada. En este contexto, al hacer uso del aprendizaje por refuerzo, podríamos determinar, en cada estado, la regla de programación más adecuada que se podría emplear para mejorar la calidad de la provisión del servicio. En este artículo, proponemos un marco basado en el aprendizaje por refuerzo para resolver problemas de programación con el enfoque principal en cumplir con los requisitos de equidad del usuario. Este marco utiliza redes neuronales de avance para mapear estados momentáneos a decisiones de parametrización adecuadas para el programador proporcionalmente justo. Los resultados de la simulación muestran que nuestro marco de aprendizaje por refuerzo supera a los programadores adaptativos convencionales orientados al objetivo de equidad. También se plantean discusiones para determinar el mejor algoritmo de aprendizaje por refuerzo que se debe implementar en el marco propuesto basado en varias configuraciones del programador.