Método de descenso de gradiente estocástico de Newton amortiguado para el entrenamiento de redes neuronales
Autores: Zhou, Jingcheng; Wei, Wei; Zhang, Ruizhi; Zheng, Zhiming
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Método de descenso de gradiente estocástico de Newton amortiguado para el entrenamiento de redes neuronales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Métodos
De segundo orden
Matriz Hessiana
Descenso de gradiente estocástico
DNNs
Regresión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Los métodos de primer orden, como el descenso de gradiente estocástico (SGD), se han vuelto recientemente populares como métodos de optimización para entrenar redes neuronales profundas (DNN) para una buena generalización; sin embargo, necesitan mucho tiempo de entrenamiento. Los métodos de segundo orden, que pueden reducir el tiempo de entrenamiento, son escasamente utilizados debido a su alto costo computacional para obtener la información de segundo orden.
Descripción
Los métodos de primer orden, como el descenso de gradiente estocástico (SGD), se han vuelto recientemente populares como métodos de optimización para entrenar redes neuronales profundas (DNN) para una buena generalización; sin embargo, necesitan mucho tiempo de entrenamiento. Los métodos de segundo orden, que pueden reducir el tiempo de entrenamiento, son escasamente utilizados debido a su alto costo computacional para obtener la información de segundo orden.