Un acelerador sistólico para reconocimiento visual neuromórfico
Autores: Tian, Shuo; Wang, Lei; Xu, Shi; Guo, Shasha; Yang, Zhijie; Zhang, Jianfeng; Xu, Weixia
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Un acelerador sistólico para reconocimiento visual neuromórfico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Neurociencia
Modelos computacionales
HMAX
Reconocimiento de objetos
Sistemas embebidos
SAFA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Los avances en neurociencia han alentado a los investigadores a centrarse en desarrollar modelos computacionales que se comporten como el cerebro humano. HMAX es uno de los modelos potencialmente inspirados biológicamente que imitan las funciones y estructuras del córtex visual de los primates. HMAX ha demostrado su eficacia y versatilidad en el reconocimiento de objetos de múltiples clases con una estructura computacional simple. Todavía es un desafío implementar el modelo HMAX en sistemas integrados debido a la fase computacional más pesada S2 de HMAX. Implementaciones anteriores como CoRe16 han utilizado un conjunto de elementos de procesamiento (PE) bidimensional reconfigurable para acelerar la capa S2 de HMAX. Sin embargo, el mecanismo del árbol de sumadores en CoRe16 utilizado para producir píxeles de salida mediante la acumulación de sumas parciales en diferentes PEs aumenta el tiempo de ejecución para HMAX. Para acelerar el proceso de ejecución de la capa S2 en HMAX, en este documento, proponemos SAFA (acelerador sistólico para HMAX), una arquitectura basada en matrices sistólicas para calcular y acelerar la etapa S2 de HMAX. Mediante el flujo de datos estacionario de salida (OS), cada PE en SAFA no solo calcula el píxel de salida de forma independiente sin acumulación adicional de sumas parciales en múltiples PEs, sino que también reduce los multiplexores aplicados en aceleradores reconfigurables. Además, el reenvío de datos para los mismos datos de entrada o peso en OS reduce los requisitos de ancho de banda de memoria. Los resultados de la simulación muestran que el tiempo de ejecución de la etapa S2 computacional más pesada en el modelo HMAX se reduce en un 5,7%, y el ancho de banda requerido para la memoria se reduce en un promedio de 3,53 veces para diferentes tamaños de kernel (excepto para kernel = 12) en comparación con CoRe16. SAFA también obtiene costos de energía y área más bajos que otros aceleradores reconfigurables a partir de la síntesis en ASIC.
Descripción
Los avances en neurociencia han alentado a los investigadores a centrarse en desarrollar modelos computacionales que se comporten como el cerebro humano. HMAX es uno de los modelos potencialmente inspirados biológicamente que imitan las funciones y estructuras del córtex visual de los primates. HMAX ha demostrado su eficacia y versatilidad en el reconocimiento de objetos de múltiples clases con una estructura computacional simple. Todavía es un desafío implementar el modelo HMAX en sistemas integrados debido a la fase computacional más pesada S2 de HMAX. Implementaciones anteriores como CoRe16 han utilizado un conjunto de elementos de procesamiento (PE) bidimensional reconfigurable para acelerar la capa S2 de HMAX. Sin embargo, el mecanismo del árbol de sumadores en CoRe16 utilizado para producir píxeles de salida mediante la acumulación de sumas parciales en diferentes PEs aumenta el tiempo de ejecución para HMAX. Para acelerar el proceso de ejecución de la capa S2 en HMAX, en este documento, proponemos SAFA (acelerador sistólico para HMAX), una arquitectura basada en matrices sistólicas para calcular y acelerar la etapa S2 de HMAX. Mediante el flujo de datos estacionario de salida (OS), cada PE en SAFA no solo calcula el píxel de salida de forma independiente sin acumulación adicional de sumas parciales en múltiples PEs, sino que también reduce los multiplexores aplicados en aceleradores reconfigurables. Además, el reenvío de datos para los mismos datos de entrada o peso en OS reduce los requisitos de ancho de banda de memoria. Los resultados de la simulación muestran que el tiempo de ejecución de la etapa S2 computacional más pesada en el modelo HMAX se reduce en un 5,7%, y el ancho de banda requerido para la memoria se reduce en un promedio de 3,53 veces para diferentes tamaños de kernel (excepto para kernel = 12) en comparación con CoRe16. SAFA también obtiene costos de energía y área más bajos que otros aceleradores reconfigurables a partir de la síntesis en ASIC.