Un algoritmo de entrenamiento para redes neuronales localmente recurrentes basado en el gradiente explícito de la función de pérdida
Autores: Carcangiu, Sara; Montisci, Augusto
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un algoritmo de entrenamiento para redes neuronales localmente recurrentes basado en el gradiente explícito de la función de pérdida
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Algoritmo
Formación
Redes Neuronales Recurrentes Locales
Complejidad computacional
Estabilidad
Gradiente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En este documento se presenta un nuevo algoritmo para el entrenamiento de Redes Neuronales Localmente Recurrentes (LRNNs), que tiene como objetivo reducir la complejidad computacional y al mismo tiempo garantizar la estabilidad de la red durante el entrenamiento. La característica principal del algoritmo propuesto es la capacidad de representar el gradiente del error en una forma explícita. El algoritmo se basa en la interpretación de la secuencia de Fibonacci como la salida de un filtro IIR de segundo orden, lo que permite utilizar la fórmula de Binet que permite calcular directamente los términos genéricos de la secuencia. Gracias a este enfoque, el gradiente de la función de pérdida durante el entrenamiento puede ser calculado explícitamente, y puede ser expresado en términos de los parámetros que controlan la estabilidad de la red neuronal.
Descripción
En este documento se presenta un nuevo algoritmo para el entrenamiento de Redes Neuronales Localmente Recurrentes (LRNNs), que tiene como objetivo reducir la complejidad computacional y al mismo tiempo garantizar la estabilidad de la red durante el entrenamiento. La característica principal del algoritmo propuesto es la capacidad de representar el gradiente del error en una forma explícita. El algoritmo se basa en la interpretación de la secuencia de Fibonacci como la salida de un filtro IIR de segundo orden, lo que permite utilizar la fórmula de Binet que permite calcular directamente los términos genéricos de la secuencia. Gracias a este enfoque, el gradiente de la función de pérdida durante el entrenamiento puede ser calculado explícitamente, y puede ser expresado en términos de los parámetros que controlan la estabilidad de la red neuronal.