logo móvil
Contáctanos

Multi-agent deep reinforcement learning-based programación y desvío de tareas de inferencia para máxima precisión de inferencia bajo restricciones de tiempo y energía

Autores: Ben Sada, Abdelkarim; Khelloufi, Amar; Naouri, Abdenacer; Ning, Huansheng; Aung, Nyothiri; Dhelim, Sahraoui

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Multi-agent deep reinforcement learning-based programación y desvío de tareas de inferencia para máxima precisión de inferencia bajo restricciones de tiempo y energía


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Viaje en tiempo real impulsado por IA
Aplicaciones de IoT
Dispositivos periféricos
Modelos de inferencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
El viaje hacia la realización de aplicaciones IoT impulsadas por IA en tiempo real enfrenta un obstáculo significativo causado por los recursos limitados de los dispositivos IoT. En particular, para los dispositivos de borde alimentados por batería, la decisión entre realizar la inferencia de tareas localmente o mediante la transferencia a servidores de borde, todo asegurando resultados oportunos y conservando energía, es un problema crítico. Este problema se complica aún más cuando un dispositivo de borde alberga múltiples modelos de inferencia locales. El desafío de asignar efectivamente modelos de inferencia a tareas entre modelos locales y modelos de servidores de borde bajo restricciones estrictas de tiempo y energía mientras se maximiza la precisión general se reconoce como un problema fuertemente NP-duro y no ha sido abordado en la literatura. Por lo tanto, en este trabajo proponemos MASITO, un nuevo marco de aprendizaje profundo de refuerzo multiagente diseñado para abordar este problema intrincado. Al dividir el problema en dos subproblemas, a saber, programación de tareas y selección de servidores de borde, proponemos un sistema multiagente cooperativo para abordar cada subproblema. El diseño de MASITO permite un entrenamiento más rápido y horarios más robustos utilizando un comportamiento cooperativo donde los agentes compensan las acciones subóptimas de los demás. Además, MASITO se adapta dinámicamente a diferentes configuraciones de red que permiten aplicaciones de computación de borde de alta movilidad. Los experimentos en el conjunto de datos ImageNet-mini demuestran la eficacia del marco, superando a los algoritmos genéticos (GAs), recocido simulado (SA) y optimización por enjambre de partículas (PSO) en tiempos de programación al proporcionar tiempos más bajos que van desde el 60% hasta el 90% mientras mantiene una precisión promedio comparable en escenarios de peor caso y una precisión superior en escenarios de mejor caso.

Otros recursos que podrían interesarte

Temas Virtualpro