La incoherencia de las redes neuronales profundas isotrópicas aumenta su rendimiento en la clasificación de imágenes

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

La incoherencia de las redes neuronales profundas isotrópicas aumenta su rendimiento en la clasificación de imágenes

Autores: Feng, Wenfeng; Zhang, Xin; Song, Qiushuang; Sun, Guoying

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

La incoherencia de las redes neuronales profundas isotrópicas aumenta su rendimiento en la clasificación de imágenes

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Arquitecturas de redes neuronales

Características estructurales

Grafos acíclicos dirigidos

Incoherencia

FoldNet

Clasificación de imágenes

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones

Aunque las arquitecturas de redes neuronales son críticas por su rendimiento, todavía no se ha explorado completamente cómo las características estructurales de una red neuronal afectan su rendimiento. Aquí, mapeamos las arquitecturas de redes neuronales a gráficos acíclicos dirigidos (DAGs) y encontramos que la incoherencia, una característica estructural para medir el orden de los DAGs, es un buen indicador para el rendimiento de las redes neuronales correspondientes. Por lo tanto, proponemos una arquitectura de red neuronal profunda isótropa mediante el plegado de una cadena de los mismos bloques y luego conectando los bloques con conexiones de salto a diferentes distancias. Nuestro modelo, llamado FoldNet, tiene dos características distintivas en comparación con las tradicionales redes neuronales residuales. En primer lugar, las distancias entre pares de bloques conectados por conexiones de salto aumentan desde siempre ser iguales a uno hasta valores diferentes seleccionados específicamente, lo que conduce a gráficos más incoherentes y permite que la red neuronal explore campos receptivos más grandes y, por lo tanto, mejore su capacidad de representación a múltiples escalas. En segundo lugar, el número de caminos directos aumenta de uno a varios, lo que conduce a una mayor proporción de caminos más cortos y, por lo tanto, mejora la propagación directa de información en toda la red. Los resultados de clasificación de imágenes en CIFAR-10 y los benchmarks de Tiny ImageNet sugirieron que nuestra nueva arquitectura de red funciona mejor que las tradicionales redes neuronales residuales. FoldNet con 25.4M parámetros puede lograr una precisión top-1 del 72.67% en Tiny ImageNet después de 100 épocas, lo cual es competitivo en comparación con los resultados de vanguardia en Tiny ImageNet.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro