logo móvil
Contáctanos

Nuevo acelerador AP2D-Net basado en CNN: una solución eficiente en área y potencia para aplicaciones en tiempo real en FPGA móviles

Autores: Li, Shuai; Sun, Kuangyuan; Luo, Yukui; Yadav, Nandakishor; Choi, Ken

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Nuevo acelerador AP2D-Net basado en CNN: una solución eficiente en área y potencia para aplicaciones en tiempo real en FPGA móviles


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Redes neuronales convolucionales
Redundancia de datos
FPGA
Eficiencia energética
Detección de objetos
Velocidad en tiempo real

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 57

Citaciones: Sin citaciones


Descripción
Las redes neuronales convolucionales estándar (CNN) tienen grandes cantidades de redundancia de datos, y se puede obtener la misma precisión incluso con pesos de bits más bajos en lugar de representación de punto flotante. La mayoría de las CNN deben desarrollarse y ejecutarse en estaciones de trabajo de gama alta basadas en GPU, por lo que es difícil trasplantar las implementaciones existentes a FPGAs portátiles de borde debido a la limitación del tamaño de almacenamiento de memoria en bloque en el chip y la capacidad de la batería. En este documento, presentamos la red conjunta de convolución adaptable punto a punto y convolución 2D (AP2D-Net), un sistema de ultra bajo consumo y relativamente alta capacidad combinado con pesos de precisión dinámica y activación. Nuestro sistema tiene un alto rendimiento, y hacemos un equilibrio entre precisión y eficiencia energética al adoptar escenarios de detección de objetos en vehículos aéreos no tripulados (UAV). Evaluamos nuestro sistema en la plataforma móvil FPGA Zynq UltraScale+ MPSoC Ultra96. La placa objetivo puede obtener una velocidad en tiempo real de 30 fps con 5.6 W, y la potencia en chip de la FPGA es solo de 0.6 W. La eficiencia energética de nuestro sistema es 2.8 veces mejor que el mejor diseño de sistema en una GPU Jetson TX2 y 1.9 veces mejor que el diseño en un FPGA PYNQ-Z1 SoC.

Otros recursos que podrían interesarte

Temas Virtualpro