Un modelo híbrido de aprendizaje profundo para la predicción de la calidad del aire basado en la relación del dominio tiempo-frecuencia
Autores: Xu, Rui; Wang, Deke; Li, Jian; Wan, Hang; Shen, Shiming; Guo, Xin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un modelo híbrido de aprendizaje profundo para la predicción de la calidad del aire basado en la relación del dominio tiempo-frecuencia
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Aprendizaje profundo
Predicción de series temporales
Calidad atmosférica
Transformada de wavelet
Modelo WTformer
Extracción de correlaciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 9
Citaciones: Sin citaciones
Los modelos de aprendizaje profundo se han utilizado ampliamente en la predicción numérica de series temporales de la calidad ambiental atmosférica. La característica fundamental de esta aplicación es descubrir la correlación entre los factores influyentes y los parámetros objetivo a través de una estructura de red profunda. Estas relaciones en los datos originales se ven afectadas por varios factores de frecuencia diferentes. Si se adopta la red profunda sin orientación, estas correlaciones pueden estar enmascaradas por datos multifrecuencia entrelazados, lo que causará el problema de la extracción insuficiente de características de correlación y la difícil interpretación del modelo. Debido a que la transformada de wavelet tiene la capacidad de separar estos datos multifrecuencia entrelazados, y estas correlaciones pueden ser extraídas por métodos de aprendizaje profundo, se diseñó un modelo híbrido que combina la transformada de wavelet y un modelo similar a transformer (WTformer) para extraer características del dominio tiempo-frecuencia y predecir la calidad del aire. Se utilizaron los datos horarios de 2018 a 2021 en Guilin como el conjunto de datos de entrenamiento de referencia. Los contaminantes y las variables meteorológicas en el conjunto de datos local se descomponen en cinco bandas de frecuencia mediante wavelet. El análisis del modelo WTformer mostró que las partículas en suspensión (PM y PM) tenían una correlación obvia en la banda de baja frecuencia y una baja correlación en la banda de alta frecuencia. PM y temperatura tenían una correlación negativa en la banda de alta frecuencia y una correlación positiva obvia en la banda de baja frecuencia. PM y velocidad del viento tenían una baja correlación en la banda de alta frecuencia y una correlación negativa obvia en la banda de baja frecuencia. Estos resultados mostraron que las leyes de las variables en el dominio tiempo-frecuencia podían ser encontradas por el modelo, lo que hizo posible explicar el modelo. Los resultados experimentales muestran que el rendimiento de predicción del modelo establecido fue mejor que el de perceptrón multicapa (MLP), red neuronal convolucional unidimensional (1D-CNN), unidad recurrente de puerta (GRU), memoria a largo y corto plazo (LSTM) y Transformer, en todos los pasos de tiempo (1, 4, 8, 24 y 48 h).
Descripción
Los modelos de aprendizaje profundo se han utilizado ampliamente en la predicción numérica de series temporales de la calidad ambiental atmosférica. La característica fundamental de esta aplicación es descubrir la correlación entre los factores influyentes y los parámetros objetivo a través de una estructura de red profunda. Estas relaciones en los datos originales se ven afectadas por varios factores de frecuencia diferentes. Si se adopta la red profunda sin orientación, estas correlaciones pueden estar enmascaradas por datos multifrecuencia entrelazados, lo que causará el problema de la extracción insuficiente de características de correlación y la difícil interpretación del modelo. Debido a que la transformada de wavelet tiene la capacidad de separar estos datos multifrecuencia entrelazados, y estas correlaciones pueden ser extraídas por métodos de aprendizaje profundo, se diseñó un modelo híbrido que combina la transformada de wavelet y un modelo similar a transformer (WTformer) para extraer características del dominio tiempo-frecuencia y predecir la calidad del aire. Se utilizaron los datos horarios de 2018 a 2021 en Guilin como el conjunto de datos de entrenamiento de referencia. Los contaminantes y las variables meteorológicas en el conjunto de datos local se descomponen en cinco bandas de frecuencia mediante wavelet. El análisis del modelo WTformer mostró que las partículas en suspensión (PM y PM) tenían una correlación obvia en la banda de baja frecuencia y una baja correlación en la banda de alta frecuencia. PM y temperatura tenían una correlación negativa en la banda de alta frecuencia y una correlación positiva obvia en la banda de baja frecuencia. PM y velocidad del viento tenían una baja correlación en la banda de alta frecuencia y una correlación negativa obvia en la banda de baja frecuencia. Estos resultados mostraron que las leyes de las variables en el dominio tiempo-frecuencia podían ser encontradas por el modelo, lo que hizo posible explicar el modelo. Los resultados experimentales muestran que el rendimiento de predicción del modelo establecido fue mejor que el de perceptrón multicapa (MLP), red neuronal convolucional unidimensional (1D-CNN), unidad recurrente de puerta (GRU), memoria a largo y corto plazo (LSTM) y Transformer, en todos los pasos de tiempo (1, 4, 8, 24 y 48 h).