Un eficiente técnica de optimización para entrenar redes neuronales profundas
Autores: Mehmood, Faisal; Ahmad, Shabir; Whangbo, Taeg Keun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un eficiente técnica de optimización para entrenar redes neuronales profundas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje profundo
Red neuronal
Visión por computadora
Optimizadores
Modelos
Proceso de entrenamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
El aprendizaje profundo es una subrama de la inteligencia artificial que adquiere conocimiento mediante el entrenamiento de una red neuronal. Tiene muchas aplicaciones en el campo de la banca, la industria automotriz, la agricultura y la industria de la salud. El aprendizaje profundo ha desempeñado un papel significativo en la resolución de tareas complejas relacionadas con la visión por computadora, como la clasificación de imágenes, el procesamiento del lenguaje natural y la detección de objetos. Por otro lado, los optimizadores también desempeñan un papel intrínseco en el entrenamiento del modelo de aprendizaje profundo. Estudios recientes han propuesto muchos modelos de aprendizaje profundo, como VGG, ResNet, DenseNet e ImageNet. Además, hay muchos optimizadores como el descenso de gradiente estocástico (SGD), Adam, AdaDelta, Adabelief y AdaMax. En este estudio, hemos seleccionado aquellos modelos que requieren menores requisitos de hardware y tiempos de entrenamiento más cortos, lo que facilita el proceso de entrenamiento en general. Hemos modificado los optimizadores basados en Adam y minimizado el camino cíclico. Hemos eliminado un hiperparámetro adicional de RMSProp y observado que el optimizador funciona con varios modelos. La tasa de aprendizaje se establece en mínimo y constante. Los pesos iniciales se actualizan después de cada época, lo que ayuda a mejorar la precisión del modelo. También cambiamos la posición del epsilon en el optimizador Adam por defecto. Al cambiar la posición del epsilon, se acumula el proceso de actualización. Utilizamos varios modelos con SGD, Adam, RMSProp y la técnica de optimización propuesta. Los resultados indican que el método propuesto es efectivo para lograr la precisión y funciona bien con las arquitecturas de vanguardia.
Descripción
El aprendizaje profundo es una subrama de la inteligencia artificial que adquiere conocimiento mediante el entrenamiento de una red neuronal. Tiene muchas aplicaciones en el campo de la banca, la industria automotriz, la agricultura y la industria de la salud. El aprendizaje profundo ha desempeñado un papel significativo en la resolución de tareas complejas relacionadas con la visión por computadora, como la clasificación de imágenes, el procesamiento del lenguaje natural y la detección de objetos. Por otro lado, los optimizadores también desempeñan un papel intrínseco en el entrenamiento del modelo de aprendizaje profundo. Estudios recientes han propuesto muchos modelos de aprendizaje profundo, como VGG, ResNet, DenseNet e ImageNet. Además, hay muchos optimizadores como el descenso de gradiente estocástico (SGD), Adam, AdaDelta, Adabelief y AdaMax. En este estudio, hemos seleccionado aquellos modelos que requieren menores requisitos de hardware y tiempos de entrenamiento más cortos, lo que facilita el proceso de entrenamiento en general. Hemos modificado los optimizadores basados en Adam y minimizado el camino cíclico. Hemos eliminado un hiperparámetro adicional de RMSProp y observado que el optimizador funciona con varios modelos. La tasa de aprendizaje se establece en mínimo y constante. Los pesos iniciales se actualizan después de cada época, lo que ayuda a mejorar la precisión del modelo. También cambiamos la posición del epsilon en el optimizador Adam por defecto. Al cambiar la posición del epsilon, se acumula el proceso de actualización. Utilizamos varios modelos con SGD, Adam, RMSProp y la técnica de optimización propuesta. Los resultados indican que el método propuesto es efectivo para lograr la precisión y funciona bien con las arquitecturas de vanguardia.