D3AT-LSTM: un modelo eficiente para la predicción de temperatura espaciotemporal basado en mecanismos de atención
Autores: Tian, Ting; Wu, Huijing; Liu, Xianhua; Hu, Qiao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
D3AT-LSTM: un modelo eficiente para la predicción de temperatura espaciotemporal basado en mecanismos de atención
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Predicción de temperatura
Variables meteorológicas
Red neuronal convolucional
Red cíclica con atención basada en compuertas
Patrones espacio-temporales
Serie histórica meteorológica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
La predicción precisa de la temperatura es esencial para la producción económica y la vida diaria de la sociedad humana. Sin embargo, la mayoría de los métodos actuales se centran únicamente en la modelización y predicción de series temporales de temperatura, ignorando la compleja interacción de variables meteorológicas en el dominio espacial. En este documento, se propone un nuevo modelo de predicción de temperatura (D3AT-LSTM) mediante la combinación de la red neuronal convolucional tridimensional (3DCNN) y la red cíclica con compuertas basada en atención. Primero, se combinan las series meteorológicas históricas de ocho píxeles circundantes para construir un tensor de características multidimensional que integra variables del dominio temporal como datos de entrada. Las unidades convolucionales se utilizan para modelar y analizar los patrones espacio-temporales de la secuencia local en módulos de CNN combinándolos con mecanismos de atención paralelos. Finalmente, la capa completamente conectada realiza la predicción final de temperatura. Este método se compara posteriormente con modelos de predicción clásicos y de última generación como ARIMA (AR), red neuronal de memoria a corto plazo (LSTM) y Transformer utilizando tres índices: el error cuadrático medio (RMSE), el error absoluto medio (MAE) y el coeficiente de determinación. Los resultados indican que el modelo D3AT-LSTM puede lograr una buena precisión de predicción en comparación con AR, LSTMs y Transformer.
Descripción
La predicción precisa de la temperatura es esencial para la producción económica y la vida diaria de la sociedad humana. Sin embargo, la mayoría de los métodos actuales se centran únicamente en la modelización y predicción de series temporales de temperatura, ignorando la compleja interacción de variables meteorológicas en el dominio espacial. En este documento, se propone un nuevo modelo de predicción de temperatura (D3AT-LSTM) mediante la combinación de la red neuronal convolucional tridimensional (3DCNN) y la red cíclica con compuertas basada en atención. Primero, se combinan las series meteorológicas históricas de ocho píxeles circundantes para construir un tensor de características multidimensional que integra variables del dominio temporal como datos de entrada. Las unidades convolucionales se utilizan para modelar y analizar los patrones espacio-temporales de la secuencia local en módulos de CNN combinándolos con mecanismos de atención paralelos. Finalmente, la capa completamente conectada realiza la predicción final de temperatura. Este método se compara posteriormente con modelos de predicción clásicos y de última generación como ARIMA (AR), red neuronal de memoria a corto plazo (LSTM) y Transformer utilizando tres índices: el error cuadrático medio (RMSE), el error absoluto medio (MAE) y el coeficiente de determinación. Los resultados indican que el modelo D3AT-LSTM puede lograr una buena precisión de predicción en comparación con AR, LSTMs y Transformer.