logo móvil
Contáctanos

Una estrategia de descarga de tareas basada en aprendizaje por refuerzo multiagente en una red de computación en el borde habilitada por blockchain

Autores: Liu, Chenlei; Sun, Zhixin

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Una estrategia de descarga de tareas basada en aprendizaje por refuerzo multiagente en una red de computación en el borde habilitada por blockchain


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Propuesto
Tecnología de blockchain
Computación en el borde móvil
Aprendizaje por refuerzo
Objetivos de optimización
Grupo de memoria global

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones


Descripción
En los últimos años, muchas soluciones de redes de informática en el borde móvil han mejorado la privacidad y seguridad de los datos y han construido un mecanismo de red confiable al introducir la tecnología blockchain. Sin embargo, esto también complica el problema de la asignación de tareas en la informática en el borde móvil habilitada para blockchain, y los algoritmos tradicionales de aprendizaje evolutivo y de aprendizaje por refuerzo de un solo agente son difíciles de resolver de manera efectiva. En este documento, proponemos una estrategia de asignación de tareas en la informática en el borde móvil habilitada para blockchain basada en el aprendizaje por refuerzo multiagente. Primero, proponemos de manera innovadora un modelo de asignación de tareas en la informática en el borde móvil habilitado para blockchain considerando de manera integral objetivos de optimización como el consumo de energía en la ejecución de tareas, el retraso en el procesamiento, las métricas de privacidad del usuario y las recompensas de incentivos de blockchain. Luego, proponemos un algoritmo de aprendizaje por refuerzo profundo basado en múltiples agentes que comparten un pool de memoria global utilizando la arquitectura actor-critic, lo que permite que cada agente adquiera la experiencia de otro agente durante el proceso de entrenamiento para mejorar la capacidad de colaboración entre agentes y el rendimiento general. Además, adoptamos ruido gaussiano atenuable en el proceso de selección del espacio de acción en la red actor para evitar caer en el óptimo local. Finalmente, los experimentos muestran que el rendimiento de cálculo de costos integral de este esquema se mejora en más del 10% en comparación con otros algoritmos de aprendizaje por refuerzo multiagente. Además, la selección de espacio de acción basada en ruido gaussiano aleatorio y un pool de memoria global mejoran el rendimiento en un 38.36% y 43.59%, respectivamente.

Otros recursos que podrían interesarte

Temas Virtualpro