logo móvil
Contáctanos

Aprendizaje profundo basado en refuerzo parcial para la asignación de tareas y recursos en un entorno de computación en el borde

Autores: Ke, Hongchang; Wang, Hui; Sun, Hongbin

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Aprendizaje profundo basado en refuerzo parcial para la asignación de tareas y recursos en un entorno de computación en el borde


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Entorno de comunicación de datos denso
Redes inalámbricas 5G
Computación en el borde móvil (MEC)
Tareas de computación
Nodo inalámbrico (WN)
Servidores MEC

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones


Descripción
En el entorno denso de comunicación de datos de las redes inalámbricas 5G, con el aumento dramático en la cantidad de tareas de cálculo de solicitud generadas por nodos móviles inalámbricos inteligentes, su capacidad de cálculo no puede cumplir con los requisitos de baja latencia y alta confiabilidad. La computación en el borde móvil (MEC) puede utilizar sus servidores con gran potencia de cálculo y más cercanos para abordar las tareas de cálculo descargadas por el nodo inalámbrico (WN). La ubicación física del servidor MEC está más cerca del WN, cumpliendo así con los requisitos de baja latencia y alta confiabilidad. En este documento, implementamos un marco MEC con múltiples WNs y múltiples servidores MEC, que consideran la aleatoriedad y divisibilidad de las tareas de solicitud de llegada del WN, el estado del canal variable en el tiempo entre el WN y el servidor MEC, y las diferentes prioridades de las tareas. En el sistema MEC propuesto, presentamos un algoritmo de asignación de recursos y descarga de tareas parcial basado en aprendizaje profundo de refuerzo multiagente descentralizado (DeMADRL) para minimizar el costo ponderado a largo plazo que incluye el costo de retraso y el costo de ancho de banda. DeMADRL es un esquema sin modelo basado en Double Deep Q-Learning (DDQN) y puede obtener la política óptima de toma de decisiones de asignación de ancho de banda y descarga de cálculo entrenando las redes neuronales. Los resultados de simulación exhaustivos muestran que el esquema de optimización DeMADRL propuesto tiene una buena convergencia y supera a los otros tres algoritmos base.

Otros recursos que podrían interesarte

Temas Virtualpro