Mejorando el rendimiento de la estimación para la exploración del espacio de diseño de aceleradores de redes neuronales convolucionales
Autores: Ferianc, Martin; Fan, Hongxiang; Manocha, Divyansh; Zhou, Hongyu; Liu, Shuanglong; Niu, Xinyu; Luk, Wayne
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Mejorando el rendimiento de la estimación para la exploración del espacio de diseño de aceleradores de redes neuronales convolucionales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Avances
Redes neuronales
Aceleradores
Exploración del espacio de diseño
Predicción de rendimiento
Regresión de procesos gaussianos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Los avances contemporáneos en redes neuronales (NNs) han demostrado su potencial en diferentes aplicaciones como la clasificación de imágenes, la detección de objetos o el procesamiento del lenguaje natural. En particular, los aceleradores reconfigurables han sido ampliamente utilizados para la aceleración de NNs debido a su reconfigurabilidad y eficiencia en instancias de aplicaciones específicas. Para determinar la configuración del acelerador, es necesario llevar a cabo una exploración del espacio de diseño para optimizar el rendimiento. Sin embargo, el proceso de exploración del espacio de diseño es consumidor de tiempo debido a la lenta evaluación del rendimiento para diferentes configuraciones. Por lo tanto, hay una demanda de un método preciso y rápido de predicción de rendimiento para acelerar la exploración del espacio de diseño. Este trabajo introduce un método novedoso para la estimación rápida y precisa de diferentes métricas que son importantes al realizar la exploración del espacio de diseño. El método se basa en un modelo de regresión de proceso gaussiano parametrizado por las características del acelerador y la NN objetivo a acelerar. Evaluamos el método propuesto junto con otros métodos populares basados en aprendizaje automático en la estimación de la latencia y el consumo de energía de nuestro acelerador implementado en dos plataformas de hardware diferentes dirigidas a redes neuronales convolucionales. Demostramos mejoras en la precisión de la estimación, sin necesidad de un esfuerzo de implementación significativo o ajuste.
Descripción
Los avances contemporáneos en redes neuronales (NNs) han demostrado su potencial en diferentes aplicaciones como la clasificación de imágenes, la detección de objetos o el procesamiento del lenguaje natural. En particular, los aceleradores reconfigurables han sido ampliamente utilizados para la aceleración de NNs debido a su reconfigurabilidad y eficiencia en instancias de aplicaciones específicas. Para determinar la configuración del acelerador, es necesario llevar a cabo una exploración del espacio de diseño para optimizar el rendimiento. Sin embargo, el proceso de exploración del espacio de diseño es consumidor de tiempo debido a la lenta evaluación del rendimiento para diferentes configuraciones. Por lo tanto, hay una demanda de un método preciso y rápido de predicción de rendimiento para acelerar la exploración del espacio de diseño. Este trabajo introduce un método novedoso para la estimación rápida y precisa de diferentes métricas que son importantes al realizar la exploración del espacio de diseño. El método se basa en un modelo de regresión de proceso gaussiano parametrizado por las características del acelerador y la NN objetivo a acelerar. Evaluamos el método propuesto junto con otros métodos populares basados en aprendizaje automático en la estimación de la latencia y el consumo de energía de nuestro acelerador implementado en dos plataformas de hardware diferentes dirigidas a redes neuronales convolucionales. Demostramos mejoras en la precisión de la estimación, sin necesidad de un esfuerzo de implementación significativo o ajuste.