logo móvil
Contáctanos

Acelerando la búsqueda extrema de funciones multidimensionales basada en el descenso de gradiente natural con distribuciones de Dirichlet

Autores: Abdulkadirov, Ruslan; Lyakhov, Pavel; Nagornov, Nikolay

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Acelerando la búsqueda extrema de funciones multidimensionales basada en el descenso de gradiente natural con distribuciones de Dirichlet


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Precisión
Redes neuronales
Algoritmo de optimización
Descenso de gradiente natural
Función de pérdida
Funciones multidimensionales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
El alto logro de precisión, utilizando arquitecturas menos complejas de redes neuronales, sigue siendo uno de los problemas más importantes en el aprendizaje automático. En muchos estudios, aumentar la calidad de reconocimiento y predicción se logra mediante la extensión de redes neuronales con neuronas habituales o especiales, lo que aumenta significativamente el tiempo de entrenamiento. Sin embargo, al utilizar un algoritmo de optimización que nos brinda un valor de la función de pérdida en el vecindario del mínimo global, se puede reducir el número de capas y épocas. En este trabajo, exploramos la búsqueda extrema de funciones multidimensionales mediante un descenso de gradiente natural propuesto basado en distribuciones de Dirichlet y Dirichlet generalizadas. El gradiente natural se basa en describir una superficie multidimensional con distribuciones de probabilidad, lo que nos permite reducir el cambio en la precisión del gradiente y el tamaño del paso. El algoritmo propuesto está equipado con adaptación del tamaño del paso, lo que le permite obtener una mayor precisión, tomando un pequeño número de iteraciones en el proceso de minimización, en comparación con el descenso de gradiente habitual y la estimación del momento adaptativo. Realizamos experimentos en funciones de prueba en espacios de cuatro y tres dimensiones, donde el descenso de gradiente natural demuestra su capacidad para converger en el vecindario del mínimo global. Este enfoque puede encontrar su aplicación en la minimización de la función de pérdida en varios tipos de redes neuronales, como convolucionales, recurrentes, de impulsos y cuánticas.

Otros recursos que podrían interesarte

Temas Virtualpro