Un acelerador de MobileNets de baja memoria basado en FPGA para tareas médicas auxiliares
Autores: Lin, Yanru; Zhang, Yanjun; Yang, Xu
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un acelerador de MobileNets de baja memoria basado en FPGA para tareas médicas auxiliares
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Redes neuronales convolucionales
MobileNet
Operaciones
Parámetros
Estructura del acelerador
Memoria
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Las redes neuronales convolucionales (CNNs) se han aplicado ampliamente en los campos de tareas médicas porque pueden lograr alta precisión en muchos campos utilizando un gran número de parámetros y operaciones. Sin embargo, muchas aplicaciones diseñadas para controles auxiliares o ayuda necesitan ser desplegadas en dispositivos portátiles, donde el enorme número de operaciones y parámetros de una CNN estándar puede convertirse en una obstrucción. MobileNet adopta una convolución separable en profundidad para reemplazar la convolución estándar, lo que puede reducir en gran medida el número de operaciones y parámetros manteniendo una precisión relativamente alta. Tales modelos altamente estructurados son muy adecuados para la implementación en FPGA para reducir aún más los requisitos de recursos y mejorar la eficiencia. Muchas otras implementaciones se centran en el rendimiento más que en los requisitos de recursos porque MobileNets ya ha reducido tanto parámetros como operaciones y ha obtenido resultados significativos. Sin embargo, debido a que muchos dispositivos pequeños solo tienen recursos limitados, no pueden ejecutar redes eficientes similares a MobileNet de manera normal, y aún hay muchas aplicaciones médicas auxiliares que requieren una red de alto rendimiento que se ejecute en tiempo real para cumplir con los requisitos. Por lo tanto, necesitamos idear una estructura de acelerador específica para reducir aún más los requisitos de memoria y otros recursos mientras se ejecutan redes eficientes similares a MobileNet. En este documento, se propone un acelerador MobileNet para minimizar la capacidad de memoria en chip y la cantidad de datos transferidos entre la memoria en chip y fuera de chip. Proponemos dos módulos de cómputo configurables: Acelerador de Convolución Puntual y Acelerador de Convolución en Profundidad, para paralelizar la red y reducir el requisito de memoria con un modelo de flujo de datos específico. Al mismo tiempo, también se propone un nuevo método de uso de caché para reducir aún más el uso de la memoria en chip. Implementamos el acelerador en Xilinx XC7Z020, desplegamos MobileNetV2 en él y logramos 70.94 FPS con un uso de memoria en chip de 524.25 KB a 150 MHz.
Descripción
Las redes neuronales convolucionales (CNNs) se han aplicado ampliamente en los campos de tareas médicas porque pueden lograr alta precisión en muchos campos utilizando un gran número de parámetros y operaciones. Sin embargo, muchas aplicaciones diseñadas para controles auxiliares o ayuda necesitan ser desplegadas en dispositivos portátiles, donde el enorme número de operaciones y parámetros de una CNN estándar puede convertirse en una obstrucción. MobileNet adopta una convolución separable en profundidad para reemplazar la convolución estándar, lo que puede reducir en gran medida el número de operaciones y parámetros manteniendo una precisión relativamente alta. Tales modelos altamente estructurados son muy adecuados para la implementación en FPGA para reducir aún más los requisitos de recursos y mejorar la eficiencia. Muchas otras implementaciones se centran en el rendimiento más que en los requisitos de recursos porque MobileNets ya ha reducido tanto parámetros como operaciones y ha obtenido resultados significativos. Sin embargo, debido a que muchos dispositivos pequeños solo tienen recursos limitados, no pueden ejecutar redes eficientes similares a MobileNet de manera normal, y aún hay muchas aplicaciones médicas auxiliares que requieren una red de alto rendimiento que se ejecute en tiempo real para cumplir con los requisitos. Por lo tanto, necesitamos idear una estructura de acelerador específica para reducir aún más los requisitos de memoria y otros recursos mientras se ejecutan redes eficientes similares a MobileNet. En este documento, se propone un acelerador MobileNet para minimizar la capacidad de memoria en chip y la cantidad de datos transferidos entre la memoria en chip y fuera de chip. Proponemos dos módulos de cómputo configurables: Acelerador de Convolución Puntual y Acelerador de Convolución en Profundidad, para paralelizar la red y reducir el requisito de memoria con un modelo de flujo de datos específico. Al mismo tiempo, también se propone un nuevo método de uso de caché para reducir aún más el uso de la memoria en chip. Implementamos el acelerador en Xilinx XC7Z020, desplegamos MobileNetV2 en él y logramos 70.94 FPS con un uso de memoria en chip de 524.25 KB a 150 MHz.