Acelerador de red neuronal profunda eficiente en energía que minimiza el acceso global al búfer sin transferencia de datos entre unidades vecinas de multiplicador-acumulador
Autores: Lee, Jeonghyeok; Han, Sangwook; Choi, Seungwon; Choi, Jungwook
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Acelerador de red neuronal profunda eficiente en energía que minimiza el acceso global al búfer sin transferencia de datos entre unidades vecinas de multiplicador-acumulador
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Nuevo método
Consumo de energía
Movimiento de datos de peso
Operación convolucional
Acelerador de redes neuronales profundas
Ahorro de energía
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Este documento presenta un método novedoso para minimizar el consumo de energía de los movimientos de datos de peso requeridos por una operación de convolución realizada en un array de multiplicador-acumulador (MAC) bidimensional de un acelerador de red neuronal profunda. La técnica propuesta emplea un archivo de registro local (LRF) en cada unidad MAC de manera que una vez que los píxeles de peso se leen desde el búfer global al LRF, se reutilizan desde el LRF tantas veces como se desee en lugar de ser recuperados repetidamente desde el búfer global en cada operación de convolución. Uno de los méritos más evidentes del método propuesto es que el procedimiento está completamente libre de la carga de transferencia de datos entre unidades MAC vecinas. Se encontró en nuestras simulaciones que el método propuesto proporciona un ahorro de energía de aproximadamente 83.33% y 97.62% en comparación con los ahorros de energía registrados por los métodos convencionales, respectivamente, cuando las dimensiones de la matriz de datos de entrada y la matriz de pesos son 128 x 128 y 5 x 5, respectivamente. Los ahorros de energía aumentan a medida que aumentan las dimensiones de la matriz de datos de entrada o la matriz de pesos.
Descripción
Este documento presenta un método novedoso para minimizar el consumo de energía de los movimientos de datos de peso requeridos por una operación de convolución realizada en un array de multiplicador-acumulador (MAC) bidimensional de un acelerador de red neuronal profunda. La técnica propuesta emplea un archivo de registro local (LRF) en cada unidad MAC de manera que una vez que los píxeles de peso se leen desde el búfer global al LRF, se reutilizan desde el LRF tantas veces como se desee en lugar de ser recuperados repetidamente desde el búfer global en cada operación de convolución. Uno de los méritos más evidentes del método propuesto es que el procedimiento está completamente libre de la carga de transferencia de datos entre unidades MAC vecinas. Se encontró en nuestras simulaciones que el método propuesto proporciona un ahorro de energía de aproximadamente 83.33% y 97.62% en comparación con los ahorros de energía registrados por los métodos convencionales, respectivamente, cuando las dimensiones de la matriz de datos de entrada y la matriz de pesos son 128 x 128 y 5 x 5, respectivamente. Los ahorros de energía aumentan a medida que aumentan las dimensiones de la matriz de datos de entrada o la matriz de pesos.