Multi-agent deep reinforcement learning-based programación y desvío de tareas de inferencia para máxima precisión de inferencia bajo restricciones de tiempo y energía
Autores: Ben Sada, Abdelkarim; Khelloufi, Amar; Naouri, Abdenacer; Ning, Huansheng; Aung, Nyothiri; Dhelim, Sahraoui
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Multi-agent deep reinforcement learning-based programación y desvío de tareas de inferencia para máxima precisión de inferencia bajo restricciones de tiempo y energía
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Viaje en tiempo real impulsado por IA
Aplicaciones de IoT
Dispositivos periféricos
Modelos de inferencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
El viaje hacia la realización de aplicaciones IoT impulsadas por IA en tiempo real enfrenta un obstáculo significativo causado por los recursos limitados de los dispositivos IoT. En particular, para los dispositivos de borde alimentados por batería, la decisión entre realizar la inferencia de tareas localmente o mediante la transferencia a servidores de borde, todo asegurando resultados oportunos y conservando energía, es un problema crítico. Este problema se complica aún más cuando un dispositivo de borde alberga múltiples modelos de inferencia locales. El desafío de asignar efectivamente modelos de inferencia a tareas entre modelos locales y modelos de servidores de borde bajo restricciones estrictas de tiempo y energía mientras se maximiza la precisión general se reconoce como un problema fuertemente NP-duro y no ha sido abordado en la literatura. Por lo tanto, en este trabajo proponemos MASITO, un nuevo marco de aprendizaje profundo de refuerzo multiagente diseñado para abordar este problema intrincado. Al dividir el problema en dos subproblemas, a saber, programación de tareas y selección de servidores de borde, proponemos un sistema multiagente cooperativo para abordar cada subproblema. El diseño de MASITO permite un entrenamiento más rápido y horarios más robustos utilizando un comportamiento cooperativo donde los agentes compensan las acciones subóptimas de los demás. Además, MASITO se adapta dinámicamente a diferentes configuraciones de red que permiten aplicaciones de computación de borde de alta movilidad. Los experimentos en el conjunto de datos ImageNet-mini demuestran la eficacia del marco, superando a los algoritmos genéticos (GAs), recocido simulado (SA) y optimización por enjambre de partículas (PSO) en tiempos de programación al proporcionar tiempos más bajos que van desde el 60% hasta el 90% mientras mantiene una precisión promedio comparable en escenarios de peor caso y una precisión superior en escenarios de mejor caso.
Descripción
El viaje hacia la realización de aplicaciones IoT impulsadas por IA en tiempo real enfrenta un obstáculo significativo causado por los recursos limitados de los dispositivos IoT. En particular, para los dispositivos de borde alimentados por batería, la decisión entre realizar la inferencia de tareas localmente o mediante la transferencia a servidores de borde, todo asegurando resultados oportunos y conservando energía, es un problema crítico. Este problema se complica aún más cuando un dispositivo de borde alberga múltiples modelos de inferencia locales. El desafío de asignar efectivamente modelos de inferencia a tareas entre modelos locales y modelos de servidores de borde bajo restricciones estrictas de tiempo y energía mientras se maximiza la precisión general se reconoce como un problema fuertemente NP-duro y no ha sido abordado en la literatura. Por lo tanto, en este trabajo proponemos MASITO, un nuevo marco de aprendizaje profundo de refuerzo multiagente diseñado para abordar este problema intrincado. Al dividir el problema en dos subproblemas, a saber, programación de tareas y selección de servidores de borde, proponemos un sistema multiagente cooperativo para abordar cada subproblema. El diseño de MASITO permite un entrenamiento más rápido y horarios más robustos utilizando un comportamiento cooperativo donde los agentes compensan las acciones subóptimas de los demás. Además, MASITO se adapta dinámicamente a diferentes configuraciones de red que permiten aplicaciones de computación de borde de alta movilidad. Los experimentos en el conjunto de datos ImageNet-mini demuestran la eficacia del marco, superando a los algoritmos genéticos (GAs), recocido simulado (SA) y optimización por enjambre de partículas (PSO) en tiempos de programación al proporcionar tiempos más bajos que van desde el 60% hasta el 90% mientras mantiene una precisión promedio comparable en escenarios de peor caso y una precisión superior en escenarios de mejor caso.