logo móvil
Contáctanos

Acelerador de Inferencia Multi-Modelo para Redes Neuronales Convolucionales Binarias

Autores: de Sousa, André L.; Véstias, Mário P.; Neto, Horácio C.

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Acelerador de Inferencia Multi-Modelo para Redes Neuronales Convolucionales Binarias


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Reducción del tamaño del modelo de redes neuronales convolucionales binarias
Técnica de inferencia multi-modelo
Acelerador de hardware
Sistemas embebidos
Complejidad computacional.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones


Descripción
Las redes neuronales convolucionales binarias (BCNN) han demostrado una buena precisión para modelos de redes neuronales pequeños a medianos. Su cuantización extrema de pesos y activaciones reduce la transferencia de datos fuera del chip y disminuye considerablemente la complejidad computacional de las convoluciones. Una reducción adicional en la complejidad de un modelo BCNN para una ejecución rápida puede lograrse con la reducción del tamaño del modelo a costa de la precisión de la red. En este artículo, se propone una técnica de inferencia multi-modelo para reducir el tiempo de ejecución del proceso de inferencia binarizada sin reducción de precisión.

Otros recursos que podrían interesarte

Temas Virtualpro