Una estrategia de descarga de tareas basada en aprendizaje por refuerzo multiagente en una red de computación en el borde habilitada por blockchain

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Una estrategia de descarga de tareas basada en aprendizaje por refuerzo multiagente en una red de computación en el borde habilitada por blockchain

Autores: Liu, Chenlei; Sun, Zhixin

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Una estrategia de descarga de tareas basada en aprendizaje por refuerzo multiagente en una red de computación en el borde habilitada por blockchain

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Propuesto

Tecnología de blockchain

Computación en el borde móvil

Aprendizaje por refuerzo

Objetivos de optimización

Grupo de memoria global

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones

En los últimos años, muchas soluciones de redes de informática en el borde móvil han mejorado la privacidad y seguridad de los datos y han construido un mecanismo de red confiable al introducir la tecnología blockchain. Sin embargo, esto también complica el problema de la asignación de tareas en la informática en el borde móvil habilitada para blockchain, y los algoritmos tradicionales de aprendizaje evolutivo y de aprendizaje por refuerzo de un solo agente son difíciles de resolver de manera efectiva. En este documento, proponemos una estrategia de asignación de tareas en la informática en el borde móvil habilitada para blockchain basada en el aprendizaje por refuerzo multiagente. Primero, proponemos de manera innovadora un modelo de asignación de tareas en la informática en el borde móvil habilitado para blockchain considerando de manera integral objetivos de optimización como el consumo de energía en la ejecución de tareas, el retraso en el procesamiento, las métricas de privacidad del usuario y las recompensas de incentivos de blockchain. Luego, proponemos un algoritmo de aprendizaje por refuerzo profundo basado en múltiples agentes que comparten un pool de memoria global utilizando la arquitectura actor-critic, lo que permite que cada agente adquiera la experiencia de otro agente durante el proceso de entrenamiento para mejorar la capacidad de colaboración entre agentes y el rendimiento general. Además, adoptamos ruido gaussiano atenuable en el proceso de selección del espacio de acción en la red actor para evitar caer en el óptimo local. Finalmente, los experimentos muestran que el rendimiento de cálculo de costos integral de este esquema se mejora en más del 10% en comparación con otros algoritmos de aprendizaje por refuerzo multiagente. Además, la selección de espacio de acción basada en ruido gaussiano aleatorio y un pool de memoria global mejoran el rendimiento en un 38.36% y 43.59%, respectivamente.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro