logo móvil
Contáctanos

Comparación de rendimiento de modelos de CNN utilizando análisis de flujo de gradiente

Autores: Noh, Seol-Hyun

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Comparación de rendimiento de modelos de CNN utilizando análisis de flujo de gradiente


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Redes neuronales convolucionales
Aprendizaje profundo
Visión por computadora
Procesamiento de lenguaje natural
Problema de desvanecimiento del gradiente
VGGNet

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Las redes neuronales convolucionales (CNN) se utilizan ampliamente entre las diversas técnicas de aprendizaje profundo disponibles debido a su rendimiento superior en los campos de la visión por computadora y el procesamiento del lenguaje natural. Las CNN pueden extraer de manera efectiva la localidad y la correlación de los datos de entrada utilizando estructuras en las que se aplican sucesivamente capas convolucionales a los datos de entrada. En general, el rendimiento de las redes neuronales ha mejorado a medida que ha aumentado la profundidad de las CNN. Sin embargo, un aumento en la profundidad de una CNN no siempre va acompañado de un aumento en la precisión de la red neuronal. Esto se debe a que puede surgir el problema de la desaparición del gradiente, lo que provoca que los pesos de las capas ponderadas no converjan. En consecuencia, se analizaron y compararon los flujos de gradiente de los modelos VGGNet, ResNet, SENet y DenseNet en este estudio, y se derivaron las razones de las diferencias en las tasas de error de rendimiento de los modelos.

Otros recursos que podrían interesarte

Temas Virtualpro