Eficiencia energética de aprendizaje automático en sistemas integrados utilizando hardware neuromórfico
Autores: Kang, Minseon; Lee, Yongseok; Park, Moonju
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Eficiencia energética de aprendizaje automático en sistemas integrados utilizando hardware neuromórfico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje automático
Sistemas integrados
Redes neuronales
GPU
Chips de procesamiento neuromórfico
Eficiencia energética
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Recientemente, la aplicación de aprendizaje automático en sistemas integrados ha despertado interés tanto en la comunidad de investigación como en la industria porque los sistemas integrados ubicados en el borde pueden producir una respuesta más rápida y reducir la carga de red. Sin embargo, la implementación de software de redes neuronales en Unidades de Procesamiento Central (CPUs) se considera inviable en sistemas integrados debido a la limitada fuente de alimentación. Para acelerar el procesamiento de IA, la Unidad de Procesamiento Gráfico (GPU) de muchos núcleos ha sido un dispositivo preferido sobre la CPU. Sin embargo, su eficiencia energética aún no se considera lo suficientemente buena para sistemas integrados. Entre otros enfoques para el aprendizaje automático en sistemas integrados, se espera que los chips de procesamiento neuromórfico consuman menos energía y superen el cuello de botella de memoria. En este trabajo, implementamos un sistema de detección de imágenes de peatones en un dispositivo integrado utilizando un chip neuromórfico disponible comercialmente, NM500, que se basa en la tecnología NeuroMem. El tiempo de procesamiento del NM500 y el consumo de energía se midieron a medida que el número de chips aumentaba de uno a siete, y se compararon con los de un sistema de CPU multinúcleo y un sistema integrado acelerado por GPU. Los resultados muestran que el NM500 es más eficiente en términos de energía requerida para procesar datos tanto para el aprendizaje como para la clasificación que el sistema acelerado por GPU o el sistema de CPU multinúcleo. Además, se identifican los límites y posibles mejoras del NM500 actual basados en los resultados experimentales.
Descripción
Recientemente, la aplicación de aprendizaje automático en sistemas integrados ha despertado interés tanto en la comunidad de investigación como en la industria porque los sistemas integrados ubicados en el borde pueden producir una respuesta más rápida y reducir la carga de red. Sin embargo, la implementación de software de redes neuronales en Unidades de Procesamiento Central (CPUs) se considera inviable en sistemas integrados debido a la limitada fuente de alimentación. Para acelerar el procesamiento de IA, la Unidad de Procesamiento Gráfico (GPU) de muchos núcleos ha sido un dispositivo preferido sobre la CPU. Sin embargo, su eficiencia energética aún no se considera lo suficientemente buena para sistemas integrados. Entre otros enfoques para el aprendizaje automático en sistemas integrados, se espera que los chips de procesamiento neuromórfico consuman menos energía y superen el cuello de botella de memoria. En este trabajo, implementamos un sistema de detección de imágenes de peatones en un dispositivo integrado utilizando un chip neuromórfico disponible comercialmente, NM500, que se basa en la tecnología NeuroMem. El tiempo de procesamiento del NM500 y el consumo de energía se midieron a medida que el número de chips aumentaba de uno a siete, y se compararon con los de un sistema de CPU multinúcleo y un sistema integrado acelerado por GPU. Los resultados muestran que el NM500 es más eficiente en términos de energía requerida para procesar datos tanto para el aprendizaje como para la clasificación que el sistema acelerado por GPU o el sistema de CPU multinúcleo. Además, se identifican los límites y posibles mejoras del NM500 actual basados en los resultados experimentales.