Estrategias de Descarga Descentralizadas Basadas en Aprendizaje por Refuerzo para Computación en el Borde de Múltiples Accesos

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Estrategias de Descarga Descentralizadas Basadas en Aprendizaje por Refuerzo para Computación en el Borde de Múltiples Accesos

Autores: Hu, Chunyang; Li, Jingchen; Shi, Haobin; Ning, Bin; Gu, Qiong

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

Estrategias de Descarga Descentralizadas Basadas en Aprendizaje por Refuerzo para Computación en el Borde de Múltiples Accesos

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Aprendizaje por refuerzo

Estrategias de descarga

Sistemas de computación en el borde de acceso múltiple

Entrenamiento centralizado

Ejecución descentralizada

Algoritmo de gradiente de política determinista profunda

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

El uso de tecnologías de aprendizaje por refuerzo para aprender estrategias de descarga en sistemas de computación en el borde de múltiples accesos ha sido desarrollado por investigadores. Sin embargo, los sistemas a gran escala no son adecuados para el aprendizaje por refuerzo, debido a sus enormes espacios de estado y comportamientos de descarga. Por esta razón, este trabajo introduce el mecanismo de entrenamiento centralizado y ejecución descentralizada, diseñando un modelo de aprendizaje por refuerzo descentralizado para sistemas de computación en el borde de múltiples accesos. Considerando un servidor en la nube y varios servidores en el borde, se separan el entrenamiento y la ejecución en el modelo de aprendizaje por refuerzo. La ejecución ocurre en los dispositivos de borde del sistema, y los servidores en el borde no necesitan comunicación. Por el contrario, el proceso de entrenamiento ocurre en el dispositivo en la nube, lo que provoca una menor latencia de transmisión. El método desarrollado utiliza un algoritmo de gradiente de política determinista profunda para optimizar las estrategias de descarga. El experimento simulado muestra que nuestro método puede aprender la estrategia de descarga para cada dispositivo de borde de manera eficiente.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro