Aero: un procesador de inferencia reconfigurable de 1.28 MOP/s/LUT para redes neuronales recurrentes en un FPGA con recursos limitados
Autores: Kim, Jinwon; Kim, Jiho; Kim, Tae-Hwan
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Aero: un procesador de inferencia reconfigurable de 1.28 MOP/s/LUT para redes neuronales recurrentes en un FPGA con recursos limitados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Procesador de inferencia reconfigurable eficiente en recursos
Redes neuronales recurrentes
AERO
Unidad de procesamiento vectorial
Eficiencia de recursos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
Este estudio presenta un procesador de inferencia reconfigurable eficiente en recursos para redes neuronales recurrentes (RNN), llamado AERO. AERO es programable para realizar inferencias en modelos de RNN de varios tipos. Esto fue diseñado en base a la arquitectura de conjunto de instrucciones especializada en procesar operaciones vectoriales primitivas que componen los flujos de datos de los modelos de RNN. Se incorporó una unidad de procesamiento de vectores versátil (VPU) para realizar cada operación vectorial y lograr una alta eficiencia de recursos. Con el objetivo de un bajo uso de recursos, la multiplicación en VPU se lleva a cabo sobre la base de un esquema de aproximación. Además, las funciones de activación se realizan con tablas reducidas. Desarrollamos un sistema de inferencia prototipo basado en AERO utilizando una matriz de compuertas programable de campo limitado en recursos, bajo la cual la funcionalidad de AERO fue verificada extensamente para tareas de inferencia basadas en varios modelos de RNN de diferentes tipos. Se descubrió que la eficiencia de recursos de AERO era tan alta como 1.28 MOP/s/LUT, lo que es 1.3 veces mayor que el resultado previo de última tecnología.
Descripción
Este estudio presenta un procesador de inferencia reconfigurable eficiente en recursos para redes neuronales recurrentes (RNN), llamado AERO. AERO es programable para realizar inferencias en modelos de RNN de varios tipos. Esto fue diseñado en base a la arquitectura de conjunto de instrucciones especializada en procesar operaciones vectoriales primitivas que componen los flujos de datos de los modelos de RNN. Se incorporó una unidad de procesamiento de vectores versátil (VPU) para realizar cada operación vectorial y lograr una alta eficiencia de recursos. Con el objetivo de un bajo uso de recursos, la multiplicación en VPU se lleva a cabo sobre la base de un esquema de aproximación. Además, las funciones de activación se realizan con tablas reducidas. Desarrollamos un sistema de inferencia prototipo basado en AERO utilizando una matriz de compuertas programable de campo limitado en recursos, bajo la cual la funcionalidad de AERO fue verificada extensamente para tareas de inferencia basadas en varios modelos de RNN de diferentes tipos. Se descubrió que la eficiencia de recursos de AERO era tan alta como 1.28 MOP/s/LUT, lo que es 1.3 veces mayor que el resultado previo de última tecnología.