Torres: un procesador de inferencia eficiente en recursos para redes neuronales convolucionales binarias basado en omisión de operaciones consciente de la localidad
Autores: Lee, Su-Jung; Kwak, Gil-Ho; Kim, Tae-Hwan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Torres: un procesador de inferencia eficiente en recursos para redes neuronales convolucionales binarias basado en omisión de operaciones consciente de la localidad
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Red binaria
Red neuronal convolucional
BCNN
TORRES
Procesador de inferencia
Eficiencia de recursos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Una red neuronal convolucional binaria (BCNN) es una red neuronal que promete realizar el análisis de imágenes visuales en dispositivos de recursos limitados de bajo costo. Este estudio presenta un procesador de inferencia eficiente para BCNNs, llamado TORRES. TORRES realiza inferencias de manera eficiente, omitiendo operaciones basadas en la localidad espacial inherente en los mapas de características. El proceso de entrenamiento se regulariza con el objetivo de omitir más operaciones. La microarquitectura está diseñada para omitir operaciones y generar direcciones de manera eficiente con un bajo uso de recursos. Se ha implementado un sistema de inferencia prototipo basado en TORRES en un array de compuertas programable de campo de 28 nm, y su funcionalidad ha sido verificada para tareas prácticas de inferencia. Implementado con 2.31 K LUTs, TORRES logra una velocidad de inferencia de 291.2 GOP/s, exhibiendo una eficiencia de recursos de 126.06 MOP/s/LUT. La eficiencia de recursos de TORRES es 1.45 veces mayor que la del trabajo más avanzado en el estado actual.
Descripción
Una red neuronal convolucional binaria (BCNN) es una red neuronal que promete realizar el análisis de imágenes visuales en dispositivos de recursos limitados de bajo costo. Este estudio presenta un procesador de inferencia eficiente para BCNNs, llamado TORRES. TORRES realiza inferencias de manera eficiente, omitiendo operaciones basadas en la localidad espacial inherente en los mapas de características. El proceso de entrenamiento se regulariza con el objetivo de omitir más operaciones. La microarquitectura está diseñada para omitir operaciones y generar direcciones de manera eficiente con un bajo uso de recursos. Se ha implementado un sistema de inferencia prototipo basado en TORRES en un array de compuertas programable de campo de 28 nm, y su funcionalidad ha sido verificada para tareas prácticas de inferencia. Implementado con 2.31 K LUTs, TORRES logra una velocidad de inferencia de 291.2 GOP/s, exhibiendo una eficiencia de recursos de 126.06 MOP/s/LUT. La eficiencia de recursos de TORRES es 1.45 veces mayor que la del trabajo más avanzado en el estado actual.