Hw-flow-fusion: programación entre capas para aceleradores de redes neuronales convolucionales con arquitecturas de flujo de datos
Autores: Valpreda, Emanuele; Morì, Pierpaolo; Fasfous, Nael; Vemparala, Manoj Rohit; Frickenstein, Alexander; Frickenstein, Lukas; Stechele, Walter; Passerone, Claudio; Masera, Guido; Martina, Maurizio
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Hw-flow-fusion: programación entre capas para aceleradores de redes neuronales convolucionales con arquitecturas de flujo de datos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Energía
Rendimiento
Redes neuronales convolucionales
Técnicas de programación
Reutilización de datos
Programación entre capas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La programación intercapa puede reducir el volumen de comunicación en un 51% y 53% para capas seleccionadas de VGG16-E y ResNet18 en un acelerador de matriz espacial, y disminuir la latencia en un 39% y 34% respectivamente, al tiempo que aumenta la proporción de cálculo a comunicación para mejorar la eficiencia del ancho de banda de memoria.
Descripción
La programación intercapa puede reducir el volumen de comunicación en un 51% y 53% para capas seleccionadas de VGG16-E y ResNet18 en un acelerador de matriz espacial, y disminuir la latencia en un 39% y 34% respectivamente, al tiempo que aumenta la proporción de cálculo a comunicación para mejorar la eficiencia del ancho de banda de memoria.