logo móvil
Contáctanos

Un método de predicción de series temporales multivariadas basado en una red neuronal recurrente con compuertas residuales convolucionales y atención de doble capa

Autores: Cao, Chuxin; Huang, Jianhong; Wu, Man; Lin, Zhizhe; Sun, Yan

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Un método de predicción de series temporales multivariadas basado en una red neuronal recurrente con compuertas residuales convolucionales y atención de doble capa


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Modelo híbrido convolucional recurrente
Mecanismo de atención
Módulo residual
Predicción de series temporales multivariadas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 55

Citaciones: Sin citaciones


Descripción
En la investigación de predicción de series temporales multivariables y multietapas, a menudo nos enfrentamos a los problemas de extracción insuficiente de características espaciales y de explotación insuficiente de datos históricos de series temporales, lo que también supone grandes desafíos para el análisis y la predicción de series temporales multivariables. Inspirado en el mecanismo de atención y el módulo residual, este estudio propone un método de predicción de series temporales multivariable basado en un modelo híbrido de convolucional-residual con compuertas recurrentes (CNN-DA-RGRU) con un mecanismo de atención de dos capas para resolver el problema de predicción de series temporales multivariable en estas dos etapas. Específicamente, el módulo de convolución del modelo propuesto se utiliza para extraer las características relacionales entre las secuencias, y el mecanismo de atención de dos capas puede prestar más atención a las variables relevantes y otorgarles pesos más altos para eliminar las características irrelevantes, mientras que el módulo de bucle residual con compuertas se utiliza para extraer las características variables en el tiempo de las secuencias, en el que el bloque residual se utiliza para lograr la conectividad directa y mejorar la potencia expresiva del modelo, para resolver los escenarios de explosión y desvanecimiento del gradiente, y facilitar la propagación del gradiente. Se realizaron experimentos en dos conjuntos de datos públicos utilizando el modelo propuesto para determinar los hiperparámetros del modelo, y se realizaron experimentos de ablación para verificar la efectividad del modelo; al compararlo con varios modelos, se encontró que el modelo propuesto logró buenos resultados en tareas de pronóstico de series temporales multivariables.

Otros recursos que podrían interesarte

Temas Virtualpro