Diffquant: reduciendo la diferencia de compresión para la cuantificación de redes neuronales
Autores: Zhang, Ming; Xu, Jian; Li, Weijun; Ning, Xin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Diffquant: reduciendo la diferencia de compresión para la cuantificación de redes neuronales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Red neuronal
Cuantización
Implementación
Inferencia
Conjuntos de datos etiquetados
DiffQuant
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
La cuantización de redes neuronales profundas es un método ampliamente utilizado en la implementación de dispositivos móviles o de borde para reducir eficazmente la sobrecarga de memoria y acelerar la inferencia. Sin embargo, la cuantización conlleva inevitablemente a una reducción en el rendimiento y la equivalencia de los modelos.
Descripción
La cuantización de redes neuronales profundas es un método ampliamente utilizado en la implementación de dispositivos móviles o de borde para reducir eficazmente la sobrecarga de memoria y acelerar la inferencia. Sin embargo, la cuantización conlleva inevitablemente a una reducción en el rendimiento y la equivalencia de los modelos.