Nuevo acelerador AP2D-Net basado en CNN: una solución eficiente en área y potencia para aplicaciones en tiempo real en FPGA móviles

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Nuevo acelerador AP2D-Net basado en CNN: una solución eficiente en área y potencia para aplicaciones en tiempo real en FPGA móviles

Autores: Li, Shuai; Sun, Kuangyuan; Luo, Yukui; Yadav, Nandakishor; Choi, Ken

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico

2020

Nuevo acelerador AP2D-Net basado en CNN: una solución eficiente en área y potencia para aplicaciones en tiempo real en FPGA móviles

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Redes neuronales convolucionales

Redundancia de datos

FPGA

Eficiencia energética

Detección de objetos

Velocidad en tiempo real

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 57

Citaciones: Sin citaciones

Las redes neuronales convolucionales estándar (CNN) tienen grandes cantidades de redundancia de datos, y se puede obtener la misma precisión incluso con pesos de bits más bajos en lugar de representación de punto flotante. La mayoría de las CNN deben desarrollarse y ejecutarse en estaciones de trabajo de gama alta basadas en GPU, por lo que es difícil trasplantar las implementaciones existentes a FPGAs portátiles de borde debido a la limitación del tamaño de almacenamiento de memoria en bloque en el chip y la capacidad de la batería. En este documento, presentamos la red conjunta de convolución adaptable punto a punto y convolución 2D (AP2D-Net), un sistema de ultra bajo consumo y relativamente alta capacidad combinado con pesos de precisión dinámica y activación. Nuestro sistema tiene un alto rendimiento, y hacemos un equilibrio entre precisión y eficiencia energética al adoptar escenarios de detección de objetos en vehículos aéreos no tripulados (UAV). Evaluamos nuestro sistema en la plataforma móvil FPGA Zynq UltraScale+ MPSoC Ultra96. La placa objetivo puede obtener una velocidad en tiempo real de 30 fps con 5.6 W, y la potencia en chip de la FPGA es solo de 0.6 W. La eficiencia energética de nuestro sistema es 2.8 veces mejor que el mejor diseño de sistema en una GPU Jetson TX2 y 1.9 veces mejor que el diseño en un FPGA PYNQ-Z1 SoC.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro