La incoherencia de las redes neuronales profundas isotrópicas aumenta su rendimiento en la clasificación de imágenes
Autores: Feng, Wenfeng; Zhang, Xin; Song, Qiushuang; Sun, Guoying
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
La incoherencia de las redes neuronales profundas isotrópicas aumenta su rendimiento en la clasificación de imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Arquitecturas de redes neuronales
Características estructurales
Grafos acíclicos dirigidos
Incoherencia
FoldNet
Clasificación de imágenes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Aunque las arquitecturas de redes neuronales son críticas por su rendimiento, todavía no se ha explorado completamente cómo las características estructurales de una red neuronal afectan su rendimiento. Aquí, mapeamos las arquitecturas de redes neuronales a gráficos acíclicos dirigidos (DAGs) y encontramos que la incoherencia, una característica estructural para medir el orden de los DAGs, es un buen indicador para el rendimiento de las redes neuronales correspondientes. Por lo tanto, proponemos una arquitectura de red neuronal profunda isótropa mediante el plegado de una cadena de los mismos bloques y luego conectando los bloques con conexiones de salto a diferentes distancias. Nuestro modelo, llamado FoldNet, tiene dos características distintivas en comparación con las tradicionales redes neuronales residuales. En primer lugar, las distancias entre pares de bloques conectados por conexiones de salto aumentan desde siempre ser iguales a uno hasta valores diferentes seleccionados específicamente, lo que conduce a gráficos más incoherentes y permite que la red neuronal explore campos receptivos más grandes y, por lo tanto, mejore su capacidad de representación a múltiples escalas. En segundo lugar, el número de caminos directos aumenta de uno a varios, lo que conduce a una mayor proporción de caminos más cortos y, por lo tanto, mejora la propagación directa de información en toda la red. Los resultados de clasificación de imágenes en CIFAR-10 y los benchmarks de Tiny ImageNet sugirieron que nuestra nueva arquitectura de red funciona mejor que las tradicionales redes neuronales residuales. FoldNet con 25.4M parámetros puede lograr una precisión top-1 del 72.67% en Tiny ImageNet después de 100 épocas, lo cual es competitivo en comparación con los resultados de vanguardia en Tiny ImageNet.
Descripción
Aunque las arquitecturas de redes neuronales son críticas por su rendimiento, todavía no se ha explorado completamente cómo las características estructurales de una red neuronal afectan su rendimiento. Aquí, mapeamos las arquitecturas de redes neuronales a gráficos acíclicos dirigidos (DAGs) y encontramos que la incoherencia, una característica estructural para medir el orden de los DAGs, es un buen indicador para el rendimiento de las redes neuronales correspondientes. Por lo tanto, proponemos una arquitectura de red neuronal profunda isótropa mediante el plegado de una cadena de los mismos bloques y luego conectando los bloques con conexiones de salto a diferentes distancias. Nuestro modelo, llamado FoldNet, tiene dos características distintivas en comparación con las tradicionales redes neuronales residuales. En primer lugar, las distancias entre pares de bloques conectados por conexiones de salto aumentan desde siempre ser iguales a uno hasta valores diferentes seleccionados específicamente, lo que conduce a gráficos más incoherentes y permite que la red neuronal explore campos receptivos más grandes y, por lo tanto, mejore su capacidad de representación a múltiples escalas. En segundo lugar, el número de caminos directos aumenta de uno a varios, lo que conduce a una mayor proporción de caminos más cortos y, por lo tanto, mejora la propagación directa de información en toda la red. Los resultados de clasificación de imágenes en CIFAR-10 y los benchmarks de Tiny ImageNet sugirieron que nuestra nueva arquitectura de red funciona mejor que las tradicionales redes neuronales residuales. FoldNet con 25.4M parámetros puede lograr una precisión top-1 del 72.67% en Tiny ImageNet después de 100 épocas, lo cual es competitivo en comparación con los resultados de vanguardia en Tiny ImageNet.