Comparación de rendimiento de modelos de CNN utilizando análisis de flujo de gradiente
Autores: Noh, Seol-Hyun
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Comparación de rendimiento de modelos de CNN utilizando análisis de flujo de gradiente
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Redes neuronales convolucionales
Aprendizaje profundo
Visión por computadora
Procesamiento de lenguaje natural
Problema de desvanecimiento del gradiente
VGGNet
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las redes neuronales convolucionales (CNN) se utilizan ampliamente entre las diversas técnicas de aprendizaje profundo disponibles debido a su rendimiento superior en los campos de la visión por computadora y el procesamiento del lenguaje natural. Las CNN pueden extraer de manera efectiva la localidad y la correlación de los datos de entrada utilizando estructuras en las que se aplican sucesivamente capas convolucionales a los datos de entrada. En general, el rendimiento de las redes neuronales ha mejorado a medida que ha aumentado la profundidad de las CNN. Sin embargo, un aumento en la profundidad de una CNN no siempre va acompañado de un aumento en la precisión de la red neuronal. Esto se debe a que puede surgir el problema de la desaparición del gradiente, lo que provoca que los pesos de las capas ponderadas no converjan. En consecuencia, se analizaron y compararon los flujos de gradiente de los modelos VGGNet, ResNet, SENet y DenseNet en este estudio, y se derivaron las razones de las diferencias en las tasas de error de rendimiento de los modelos.
Descripción
Las redes neuronales convolucionales (CNN) se utilizan ampliamente entre las diversas técnicas de aprendizaje profundo disponibles debido a su rendimiento superior en los campos de la visión por computadora y el procesamiento del lenguaje natural. Las CNN pueden extraer de manera efectiva la localidad y la correlación de los datos de entrada utilizando estructuras en las que se aplican sucesivamente capas convolucionales a los datos de entrada. En general, el rendimiento de las redes neuronales ha mejorado a medida que ha aumentado la profundidad de las CNN. Sin embargo, un aumento en la profundidad de una CNN no siempre va acompañado de un aumento en la precisión de la red neuronal. Esto se debe a que puede surgir el problema de la desaparición del gradiente, lo que provoca que los pesos de las capas ponderadas no converjan. En consecuencia, se analizaron y compararon los flujos de gradiente de los modelos VGGNet, ResNet, SENet y DenseNet en este estudio, y se derivaron las razones de las diferencias en las tasas de error de rendimiento de los modelos.