Un módulo de convolución de separación cuadrática multi-escala ligero para tareas de clasificación de imágenes CNN
Autores: Wang, Yunyan; Chen, Peng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un módulo de convolución de separación cuadrática multi-escala ligero para tareas de clasificación de imágenes CNN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Convolución
Parámetros de red
Velocidad del modelo
Módulo de convolución cuadrática separable a múltiples escalas
Esfuerzo computacional
Velocidad de entrenamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Actualmente, la mayoría de las redes convolucionales utilizan convolución estándar para la extracción de características con el fin de buscar precisión. Sin embargo, existe un potencial espacio para mejorar en términos del número de parámetros de red y la velocidad del modelo. Por lo tanto, este documento propone un módulo de convolución separable cuadrática multi-escala ligero (Mqscm). En primer lugar, el módulo utiliza una topología de múltiples ramas para mantener la dispersión de la arquitectura de red. En segundo lugar, se utilizan métodos de separación de canales y separación espacial para separar los núcleos de convolución, reducir la redundancia de información dentro de la red y mejorar la utilización de los recursos de cómputo de hardware. Por último, el módulo utiliza una variedad de núcleos de convolución para obtener información en diferentes escalas y garantizar el rendimiento de la red. La comparación de rendimiento en tres conjuntos de datos de clasificación de imágenes muestra que, en comparación con la convolución estándar, el módulo Mqscm reduce el esfuerzo computacional en aproximadamente un 44.5% y mejora la velocidad de entrenamiento del modelo en un rango del 14.93% al 35.41%, manteniendo niveles de rendimiento comparables a los de la convolución profunda. Además, en comparación con ResNet-50, la red de convolución pura MqscmNet reduce los parámetros en aproximadamente un 59.5%, ahorra tiempo de entrenamiento en aproximadamente un 29.7% y mejora la precisión en un 0.59%. Los resultados experimentales muestran que el módulo Mqscm reduce la carga de memoria del modelo, mejora la eficiencia y tiene un buen rendimiento.
Descripción
Actualmente, la mayoría de las redes convolucionales utilizan convolución estándar para la extracción de características con el fin de buscar precisión. Sin embargo, existe un potencial espacio para mejorar en términos del número de parámetros de red y la velocidad del modelo. Por lo tanto, este documento propone un módulo de convolución separable cuadrática multi-escala ligero (Mqscm). En primer lugar, el módulo utiliza una topología de múltiples ramas para mantener la dispersión de la arquitectura de red. En segundo lugar, se utilizan métodos de separación de canales y separación espacial para separar los núcleos de convolución, reducir la redundancia de información dentro de la red y mejorar la utilización de los recursos de cómputo de hardware. Por último, el módulo utiliza una variedad de núcleos de convolución para obtener información en diferentes escalas y garantizar el rendimiento de la red. La comparación de rendimiento en tres conjuntos de datos de clasificación de imágenes muestra que, en comparación con la convolución estándar, el módulo Mqscm reduce el esfuerzo computacional en aproximadamente un 44.5% y mejora la velocidad de entrenamiento del modelo en un rango del 14.93% al 35.41%, manteniendo niveles de rendimiento comparables a los de la convolución profunda. Además, en comparación con ResNet-50, la red de convolución pura MqscmNet reduce los parámetros en aproximadamente un 59.5%, ahorra tiempo de entrenamiento en aproximadamente un 29.7% y mejora la precisión en un 0.59%. Los resultados experimentales muestran que el módulo Mqscm reduce la carga de memoria del modelo, mejora la eficiencia y tiene un buen rendimiento.