logo móvil
Contáctanos

La incoherencia de las redes neuronales profundas isotrópicas aumenta su rendimiento en la clasificación de imágenes

Autores: Feng, Wenfeng; Zhang, Xin; Song, Qiushuang; Sun, Guoying

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

La incoherencia de las redes neuronales profundas isotrópicas aumenta su rendimiento en la clasificación de imágenes


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Arquitecturas de redes neuronales
Características estructurales
Grafos acíclicos dirigidos
Incoherencia
FoldNet
Clasificación de imágenes

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
Aunque las arquitecturas de redes neuronales son críticas por su rendimiento, todavía no se ha explorado completamente cómo las características estructurales de una red neuronal afectan su rendimiento. Aquí, mapeamos las arquitecturas de redes neuronales a gráficos acíclicos dirigidos (DAGs) y encontramos que la incoherencia, una característica estructural para medir el orden de los DAGs, es un buen indicador para el rendimiento de las redes neuronales correspondientes. Por lo tanto, proponemos una arquitectura de red neuronal profunda isótropa mediante el plegado de una cadena de los mismos bloques y luego conectando los bloques con conexiones de salto a diferentes distancias. Nuestro modelo, llamado FoldNet, tiene dos características distintivas en comparación con las tradicionales redes neuronales residuales. En primer lugar, las distancias entre pares de bloques conectados por conexiones de salto aumentan desde siempre ser iguales a uno hasta valores diferentes seleccionados específicamente, lo que conduce a gráficos más incoherentes y permite que la red neuronal explore campos receptivos más grandes y, por lo tanto, mejore su capacidad de representación a múltiples escalas. En segundo lugar, el número de caminos directos aumenta de uno a varios, lo que conduce a una mayor proporción de caminos más cortos y, por lo tanto, mejora la propagación directa de información en toda la red. Los resultados de clasificación de imágenes en CIFAR-10 y los benchmarks de Tiny ImageNet sugirieron que nuestra nueva arquitectura de red funciona mejor que las tradicionales redes neuronales residuales. FoldNet con 25.4M parámetros puede lograr una precisión top-1 del 72.67% en Tiny ImageNet después de 100 épocas, lo cual es competitivo en comparación con los resultados de vanguardia en Tiny ImageNet.

Otros recursos que podrían interesarte

Temas Virtualpro