Recientes avances en descenso de gradiente estocástico en aprendizaje profundo
Autores: Tian, Yingjie; Zhang, Yuqi; Zhang, Haibin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Recientes avances en descenso de gradiente estocástico en aprendizaje profundo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Inteligencia artificial
Manejo de datos
Modelos de aprendizaje automático
Descenso de gradiente estocástico
Aplicaciones de aprendizaje profundo
Optimizador PyTorch
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
En la era de la inteligencia artificial, el mejor enfoque para manejar grandes cantidades de datos es un problema tremendamente motivador y difícil. Entre los modelos de aprendizaje automático, el descenso de gradiente estocástico (SGD) no solo es simple sino también muy efectivo. Este estudio proporciona un análisis detallado de las aplicaciones contemporáneas de vanguardia del aprendizaje profundo, como el procesamiento del lenguaje natural (NLP), el procesamiento de datos visuales y el procesamiento de voz y audio. A continuación, este estudio presenta varias versiones de SGD y sus variantes, que ya se encuentran en el optimizador de PyTorch, incluyendo SGD, Adagrad, adadelta, RMSprop, Adam, AdamW, y así sucesivamente. Finalmente, proponemos condiciones teóricas bajo las cuales estos métodos son aplicables y descubrimos que todavía existe una brecha entre las condiciones teóricas bajo las cuales los algoritmos convergen y las aplicaciones prácticas, y cómo cerrar esta brecha es una pregunta para el futuro.
Descripción
En la era de la inteligencia artificial, el mejor enfoque para manejar grandes cantidades de datos es un problema tremendamente motivador y difícil. Entre los modelos de aprendizaje automático, el descenso de gradiente estocástico (SGD) no solo es simple sino también muy efectivo. Este estudio proporciona un análisis detallado de las aplicaciones contemporáneas de vanguardia del aprendizaje profundo, como el procesamiento del lenguaje natural (NLP), el procesamiento de datos visuales y el procesamiento de voz y audio. A continuación, este estudio presenta varias versiones de SGD y sus variantes, que ya se encuentran en el optimizador de PyTorch, incluyendo SGD, Adagrad, adadelta, RMSprop, Adam, AdamW, y así sucesivamente. Finalmente, proponemos condiciones teóricas bajo las cuales estos métodos son aplicables y descubrimos que todavía existe una brecha entre las condiciones teóricas bajo las cuales los algoritmos convergen y las aplicaciones prácticas, y cómo cerrar esta brecha es una pregunta para el futuro.