Acelerador de Inferencia Multi-Modelo para Redes Neuronales Convolucionales Binarias
Autores: de Sousa, André L.; Véstias, Mário P.; Neto, Horácio C.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Acelerador de Inferencia Multi-Modelo para Redes Neuronales Convolucionales Binarias
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reducción del tamaño del modelo de redes neuronales convolucionales binarias
Técnica de inferencia multi-modelo
Acelerador de hardware
Sistemas embebidos
Complejidad computacional.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Las redes neuronales convolucionales binarias (BCNN) han demostrado una buena precisión para modelos de redes neuronales pequeños a medianos. Su cuantización extrema de pesos y activaciones reduce la transferencia de datos fuera del chip y disminuye considerablemente la complejidad computacional de las convoluciones. Una reducción adicional en la complejidad de un modelo BCNN para una ejecución rápida puede lograrse con la reducción del tamaño del modelo a costa de la precisión de la red. En este artículo, se propone una técnica de inferencia multi-modelo para reducir el tiempo de ejecución del proceso de inferencia binarizada sin reducción de precisión.
Descripción
Las redes neuronales convolucionales binarias (BCNN) han demostrado una buena precisión para modelos de redes neuronales pequeños a medianos. Su cuantización extrema de pesos y activaciones reduce la transferencia de datos fuera del chip y disminuye considerablemente la complejidad computacional de las convoluciones. Una reducción adicional en la complejidad de un modelo BCNN para una ejecución rápida puede lograrse con la reducción del tamaño del modelo a costa de la precisión de la red. En este artículo, se propone una técnica de inferencia multi-modelo para reducir el tiempo de ejecución del proceso de inferencia binarizada sin reducción de precisión.