Modificación de la relación de aprendizaje y abandono para el algoritmo de descenso de gradiente estocástico
Autores: Teso-Fz-Betoño, Adrian; Zulueta, Ekaitz; Cabezas-Olivenza, Mireya; Fernandez-Gamiz, Unai; Botana-M-Ibarreta, Carlos
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Modificación de la relación de aprendizaje y abandono para el algoritmo de descenso de gradiente estocástico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Descenso de gradiente estocástico
Algoritmos de entrenamiento de redes neuronales
Modificaciones
Ratio de aprendizaje dinámico
Eliminación dinámica
Función de referencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El algoritmo del descenso de gradiente estocástico es uno de los algoritmos de entrenamiento de redes neuronales más populares. Muchos autores han contribuido a modificar o adaptar su forma y parametrizaciones para mejorar su rendimiento. En este documento, los autores proponen dos modificaciones en este algoritmo que pueden resultar en un mejor rendimiento sin aumentar significativamente los recursos computacionales y de tiempo necesarios. La primera es una proporción de aprendizaje dinámica que depende de la capa de la red en la que se aplica, y la segunda es una eliminación dinámica que disminuye a lo largo de las épocas de entrenamiento. Estas técnicas han sido probadas con diferentes funciones de referencia para ver su efecto en el proceso de aprendizaje. Los resultados obtenidos muestran que la aplicación de estas técnicas mejora el rendimiento del aprendizaje de la red neuronal, especialmente cuando se utilizan juntas.
Descripción
El algoritmo del descenso de gradiente estocástico es uno de los algoritmos de entrenamiento de redes neuronales más populares. Muchos autores han contribuido a modificar o adaptar su forma y parametrizaciones para mejorar su rendimiento. En este documento, los autores proponen dos modificaciones en este algoritmo que pueden resultar en un mejor rendimiento sin aumentar significativamente los recursos computacionales y de tiempo necesarios. La primera es una proporción de aprendizaje dinámica que depende de la capa de la red en la que se aplica, y la segunda es una eliminación dinámica que disminuye a lo largo de las épocas de entrenamiento. Estas técnicas han sido probadas con diferentes funciones de referencia para ver su efecto en el proceso de aprendizaje. Los resultados obtenidos muestran que la aplicación de estas técnicas mejora el rendimiento del aprendizaje de la red neuronal, especialmente cuando se utilizan juntas.