logo móvil
Contáctanos

Diffquant: reduciendo la diferencia de compresión para la cuantificación de redes neuronales

Autores: Zhang, Ming; Xu, Jian; Li, Weijun; Ning, Xin

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Diffquant: reduciendo la diferencia de compresión para la cuantificación de redes neuronales


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Red neuronal
Cuantización
Implementación
Inferencia
Conjuntos de datos etiquetados
DiffQuant

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones


Descripción
La cuantización de redes neuronales profundas es un método ampliamente utilizado en la implementación de dispositivos móviles o de borde para reducir eficazmente la sobrecarga de memoria y acelerar la inferencia. Sin embargo, la cuantización conlleva inevitablemente a una reducción en el rendimiento y la equivalencia de los modelos.

Otros recursos que podrían interesarte

Temas Virtualpro