Nuevo acelerador AP2D-Net basado en CNN: una solución eficiente en área y potencia para aplicaciones en tiempo real en FPGA móviles
Autores: Li, Shuai; Sun, Kuangyuan; Luo, Yukui; Yadav, Nandakishor; Choi, Ken
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Nuevo acelerador AP2D-Net basado en CNN: una solución eficiente en área y potencia para aplicaciones en tiempo real en FPGA móviles
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales convolucionales
Redundancia de datos
FPGA
Eficiencia energética
Detección de objetos
Velocidad en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 57
Citaciones: Sin citaciones
Las redes neuronales convolucionales estándar (CNN) tienen grandes cantidades de redundancia de datos, y se puede obtener la misma precisión incluso con pesos de bits más bajos en lugar de representación de punto flotante. La mayoría de las CNN deben desarrollarse y ejecutarse en estaciones de trabajo de gama alta basadas en GPU, por lo que es difícil trasplantar las implementaciones existentes a FPGAs portátiles de borde debido a la limitación del tamaño de almacenamiento de memoria en bloque en el chip y la capacidad de la batería. En este documento, presentamos la red conjunta de convolución adaptable punto a punto y convolución 2D (AP2D-Net), un sistema de ultra bajo consumo y relativamente alta capacidad combinado con pesos de precisión dinámica y activación. Nuestro sistema tiene un alto rendimiento, y hacemos un equilibrio entre precisión y eficiencia energética al adoptar escenarios de detección de objetos en vehículos aéreos no tripulados (UAV). Evaluamos nuestro sistema en la plataforma móvil FPGA Zynq UltraScale+ MPSoC Ultra96. La placa objetivo puede obtener una velocidad en tiempo real de 30 fps con 5.6 W, y la potencia en chip de la FPGA es solo de 0.6 W. La eficiencia energética de nuestro sistema es 2.8 veces mejor que el mejor diseño de sistema en una GPU Jetson TX2 y 1.9 veces mejor que el diseño en un FPGA PYNQ-Z1 SoC.
Descripción
Las redes neuronales convolucionales estándar (CNN) tienen grandes cantidades de redundancia de datos, y se puede obtener la misma precisión incluso con pesos de bits más bajos en lugar de representación de punto flotante. La mayoría de las CNN deben desarrollarse y ejecutarse en estaciones de trabajo de gama alta basadas en GPU, por lo que es difícil trasplantar las implementaciones existentes a FPGAs portátiles de borde debido a la limitación del tamaño de almacenamiento de memoria en bloque en el chip y la capacidad de la batería. En este documento, presentamos la red conjunta de convolución adaptable punto a punto y convolución 2D (AP2D-Net), un sistema de ultra bajo consumo y relativamente alta capacidad combinado con pesos de precisión dinámica y activación. Nuestro sistema tiene un alto rendimiento, y hacemos un equilibrio entre precisión y eficiencia energética al adoptar escenarios de detección de objetos en vehículos aéreos no tripulados (UAV). Evaluamos nuestro sistema en la plataforma móvil FPGA Zynq UltraScale+ MPSoC Ultra96. La placa objetivo puede obtener una velocidad en tiempo real de 30 fps con 5.6 W, y la potencia en chip de la FPGA es solo de 0.6 W. La eficiencia energética de nuestro sistema es 2.8 veces mejor que el mejor diseño de sistema en una GPU Jetson TX2 y 1.9 veces mejor que el diseño en un FPGA PYNQ-Z1 SoC.