Mejora de la compresión sin pérdida de JPEG para la compresión de capas intermedias en redes neuronales basada en la computación en memoria
Autores: Hua, Junyong; Xu, Hang; Du, Yuan; Du, Li
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejora de la compresión sin pérdida de JPEG para la compresión de capas intermedias en redes neuronales basada en la computación en memoria
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Desarrollo
Redes Neuronales Convolucionales
Dispositivos edge
Tecnología Compute-In-Memory
Modelos de redes neuronales profundas
Compresión sin pérdida JPEG
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Con el desarrollo de las Redes Neuronales Convolucionales (CNNs), hay una creciente necesidad de desplegarlas en dispositivos edge. Al mismo tiempo, la tecnología Compute-In-Memory (CIM) ha ganado una atención significativa en aplicaciones de CNN edge debido a su capacidad para minimizar el movimiento de datos entre la memoria y las unidades de cálculo. Sin embargo, el despliegue de modelos complejos de redes neuronales profundas en dispositivos edge con recursos de hardware limitados sigue siendo desafiado por la falta de almacenamiento adecuado para los datos de capas intermedias. En este artículo, proponemos un algoritmo optimizado de Compresión sin Pérdida JPEG (JPEG-LS) que implementa la actualización de parámetros de contexto en serie junto con la codificación paralela. Este método está diseñado para la predicción global y la compresión eficiente de capas de datos intermedias en redes neuronales que emplean técnicas CIM. Los resultados indican ratios de compresión promedio de 6.44x para VGG16, 3.62x para ResNet34, 1.67x para MobileNetV2 y 2.31x para InceptionV3. Además, la implementación logra un rendimiento de datos de 32 bits por ciclo a 600 MHz en el TSMC 28 nm, con un costo de hardware de 122 K Gate Count.
Descripción
Con el desarrollo de las Redes Neuronales Convolucionales (CNNs), hay una creciente necesidad de desplegarlas en dispositivos edge. Al mismo tiempo, la tecnología Compute-In-Memory (CIM) ha ganado una atención significativa en aplicaciones de CNN edge debido a su capacidad para minimizar el movimiento de datos entre la memoria y las unidades de cálculo. Sin embargo, el despliegue de modelos complejos de redes neuronales profundas en dispositivos edge con recursos de hardware limitados sigue siendo desafiado por la falta de almacenamiento adecuado para los datos de capas intermedias. En este artículo, proponemos un algoritmo optimizado de Compresión sin Pérdida JPEG (JPEG-LS) que implementa la actualización de parámetros de contexto en serie junto con la codificación paralela. Este método está diseñado para la predicción global y la compresión eficiente de capas de datos intermedias en redes neuronales que emplean técnicas CIM. Los resultados indican ratios de compresión promedio de 6.44x para VGG16, 3.62x para ResNet34, 1.67x para MobileNetV2 y 2.31x para InceptionV3. Además, la implementación logra un rendimiento de datos de 32 bits por ciclo a 600 MHz en el TSMC 28 nm, con un costo de hardware de 122 K Gate Count.