logo móvil
Contáctanos

HGA-DP: Particionamiento Óptimo de DNNs Multimodales que Permiten Inferencia de Imágenes en Tiempo Real para el Mantenimiento de Comunicación Asistida por AR en Sistemas de Nube-Borde-Final

Autores: Ye, Cong; Zhang, Ruihang; Li, Xiao; Deng, Wenlong; Wang, Jianlei; Shao, Sujie

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

HGA-DP: Particionamiento Óptimo de DNNs Multimodales que Permiten Inferencia de Imágenes en Tiempo Real para el Mantenimiento de Comunicación Asistida por AR en Sistemas de Nube-Borde-Final


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Realidad aumentada
Modelos multimodales
Marco de inferencia colaborativa en la nube y el borde
Algoritmo genético híbrido
Latencia de inferencia de extremo a extremo
Consumo de energía del terminal

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 2

Citaciones: Sin citaciones


Descripción
En el campo del mantenimiento de la comunicación, las aplicaciones de Realidad Aumentada (AR) son críticas para mejorar la seguridad y eficiencia operativa. Sin embargo, implementar los modelos multimodales requeridos en dispositivos terminales con recursos limitados es un desafío, ya que las estrategias tradicionales en la nube o en el dispositivo no logran equilibrar la baja latencia y el consumo de energía. Este documento propone un marco de inferencia colaborativa Cloud-Edge-End adaptado para el despliegue de modelos multimodales. Se introduce una estrategia de particionamiento de subgráficos para descomponer sistemáticamente modelos multimodales complejos en subunidades funcionalmente independientes. Posteriormente, se emplea un modelo de estimación de rendimiento de alta precisión para caracterizar con exactitud tanto los costos de computación como de comunicación en dispositivos heterogéneos. Además, se formula un problema de optimización conjunta para minimizar la latencia de inferencia de extremo a extremo y el consumo de energía del terminal. Para resolver este problema de manera eficiente, se diseña un Algoritmo Genético Híbrido para el Particionamiento de DNN (HGA-DP) evolucionado durante 100 generaciones, incorporando mecanismos de reparación conscientes de restricciones y búsqueda en el vecindario local para navegar por el espacio de búsqueda exponencial de posibles combinaciones de despliegue. Los resultados experimentales en una plataforma de computación colaborativa simulada de tres niveles demuestran que, en comparación con el despliegue completo tradicional en el dispositivo, el método propuesto reduce la latencia de inferencia de extremo a extremo en un 70-80% y el consumo de energía del terminal en un 81.1%, logrando una mejora de 4.86x en la puntuación de aptitud general. Frente a la heurística DADS optimizada para latencia, HGA-DP logra una latencia un 41.3% menor mientras reduce la energía en un 59.9%. En comparación con la estrategia All-Cloud, nuestro enfoque ofrece una reducción de latencia del 71.5% con solo un costo adicional marginal de energía del terminal. Este marco proporciona una solución adaptativa y efectiva para la inferencia multimodal en tiempo real en escenarios con recursos limitados, sentando las bases para un despliegue inteligente y consciente de los recursos.

Otros recursos que podrían interesarte

Temas Virtualpro