Análisis de mapas de características basado en la poda dinámica de CNN y la aceleración en FPGAs
Autores: Li, Qi; Li, Hengyi; Meng, Lin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Análisis de mapas de características basado en la poda dinámica de CNN y la aceleración en FPGAs
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Aprendizaje automático de gráficos
Redes neuronales convolucionales
Poda de canales
Objetivo de compresión
Poda dinámica de canales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Las aplicaciones basadas en aprendizaje profundo ofrecen resultados impresionantes para el aprendizaje automático en grafos y son ampliamente utilizadas en campos como la conducción autónoma y las traducciones de idiomas. Sin embargo, la tremenda capacidad de las redes neuronales convolucionales hace que sea difícil implementarlas en dispositivos con recursos limitados. La poda de canales proporciona una solución prometedora para comprimir redes al eliminar cálculos redundantes. Los métodos de poda existentes miden la importancia de cada filtro y descartan los menos importantes hasta alcanzar un objetivo de compresión fijo. Sin embargo, el enfoque estático limita el efecto de la poda. Por lo tanto, proponemos un método de poda de canales dinámico que identifica y elimina dinámicamente los filtros menos importantes basados en un análisis de redundancia de sus mapas de características. Los resultados experimentales muestran que se reducen un 77.10% de las operaciones de punto flotante por segundo (FLOPs) y un 91.72% de los parámetros en VGG16BN con solo una disminución del 0.54% en la precisión. Además, los modelos comprimidos se implementaron en la matriz de compuertas programable en campo (FPGA) y se observó una mejora significativa en la velocidad.
Descripción
Las aplicaciones basadas en aprendizaje profundo ofrecen resultados impresionantes para el aprendizaje automático en grafos y son ampliamente utilizadas en campos como la conducción autónoma y las traducciones de idiomas. Sin embargo, la tremenda capacidad de las redes neuronales convolucionales hace que sea difícil implementarlas en dispositivos con recursos limitados. La poda de canales proporciona una solución prometedora para comprimir redes al eliminar cálculos redundantes. Los métodos de poda existentes miden la importancia de cada filtro y descartan los menos importantes hasta alcanzar un objetivo de compresión fijo. Sin embargo, el enfoque estático limita el efecto de la poda. Por lo tanto, proponemos un método de poda de canales dinámico que identifica y elimina dinámicamente los filtros menos importantes basados en un análisis de redundancia de sus mapas de características. Los resultados experimentales muestran que se reducen un 77.10% de las operaciones de punto flotante por segundo (FLOPs) y un 91.72% de los parámetros en VGG16BN con solo una disminución del 0.54% en la precisión. Además, los modelos comprimidos se implementaron en la matriz de compuertas programable en campo (FPGA) y se observó una mejora significativa en la velocidad.