Predicción de la calidad del aire geográficamente consciente a través de un modelado híbrido CNN-LSTM-KAN con diferenciación climática y topográfica
Autores: Hu, Yue; Ding, Yitong; Jiang, Wenjing
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Predicción de la calidad del aire geográficamente consciente a través de un modelado híbrido CNN-LSTM-KAN con diferenciación climática y topográfica
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Contaminación del aire
China
Marco de aprendizaje profundo
índice de calidad del aire
Conjuntos de datos de múltiples ciudades
Redes de Kolmogorov-Arnold
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 7
Citaciones: Sin citaciones
La contaminación del aire representa un desafío global urgente, particularmente en naciones en rápida industrialización como China, donde la deterioración de la calidad del aire pone en grave peligro la salud pública y el desarrollo sostenible. Para abordar los patrones heterogéneos de la contaminación del aire en diversas regiones geográficas y climáticas, este estudio propone un novedoso marco de aprendizaje profundo híbrido CNN-LSTM-KAN para la predicción de series temporales del Índice de Calidad del Aire (AQI) con alta precisión. A través de un análisis sistemático de conjuntos de datos de AQI de múltiples ciudades que abarcan cinco metrópolis chinas representativas, seleccionadas estratégicamente para cubrir diversas zonas climáticas (subtropicales a templadas), gradientes geográficos (costera a interior) y variaciones topográficas (llanos a montañas), establecimos tres avances metodológicos principales. Primero, las pruebas de normalidad de Shapiro-Wilk (< 0.05) revelaron características de distribución no gaussiana en los datos observacionales, proporcionando justificación estadística para implementar la supresión de ruido basada en filtrado gaussiano. En segundo lugar, nuestro marco de validación multi-regional se extendió más allá de los enfoques convencionales de una sola ciudad, demostrando la generalizabilidad del modelo en distintos contextos ambientales. En tercer lugar, integramos de manera innovadora Redes Kolmogorov-Arnold (KAN) con mecanismos de atención para reemplazar las capas completamente conectadas tradicionales, logrando una mayor capacidad de ponderación de características. Los experimentos comparativos demostraron un rendimiento superior con una reducción del 23.6-59.6% en el Error Cuadrático Medio (RMSE) en relación con los modelos LSTM de referencia, junto con un rendimiento consistentemente superior sobre los híbridos CNN-LSTM. Los análisis de correlación entre regiones identificaron PM2.5/PM10 como factores predictivos dominantes. El modelo desarrollado mostró robustas capacidades de generalización a través de divisiones geográficas (R = 0.92-0.99), estableciendo una plataforma confiable de apoyo a la decisión para sistemas de alerta temprana de calidad del aire adaptativos a nivel regional. Este marco metodológico proporciona valiosas ideas para abordar la heterogeneidad espacial en aplicaciones de modelado ambiental.
Descripción
La contaminación del aire representa un desafío global urgente, particularmente en naciones en rápida industrialización como China, donde la deterioración de la calidad del aire pone en grave peligro la salud pública y el desarrollo sostenible. Para abordar los patrones heterogéneos de la contaminación del aire en diversas regiones geográficas y climáticas, este estudio propone un novedoso marco de aprendizaje profundo híbrido CNN-LSTM-KAN para la predicción de series temporales del Índice de Calidad del Aire (AQI) con alta precisión. A través de un análisis sistemático de conjuntos de datos de AQI de múltiples ciudades que abarcan cinco metrópolis chinas representativas, seleccionadas estratégicamente para cubrir diversas zonas climáticas (subtropicales a templadas), gradientes geográficos (costera a interior) y variaciones topográficas (llanos a montañas), establecimos tres avances metodológicos principales. Primero, las pruebas de normalidad de Shapiro-Wilk (< 0.05) revelaron características de distribución no gaussiana en los datos observacionales, proporcionando justificación estadística para implementar la supresión de ruido basada en filtrado gaussiano. En segundo lugar, nuestro marco de validación multi-regional se extendió más allá de los enfoques convencionales de una sola ciudad, demostrando la generalizabilidad del modelo en distintos contextos ambientales. En tercer lugar, integramos de manera innovadora Redes Kolmogorov-Arnold (KAN) con mecanismos de atención para reemplazar las capas completamente conectadas tradicionales, logrando una mayor capacidad de ponderación de características. Los experimentos comparativos demostraron un rendimiento superior con una reducción del 23.6-59.6% en el Error Cuadrático Medio (RMSE) en relación con los modelos LSTM de referencia, junto con un rendimiento consistentemente superior sobre los híbridos CNN-LSTM. Los análisis de correlación entre regiones identificaron PM2.5/PM10 como factores predictivos dominantes. El modelo desarrollado mostró robustas capacidades de generalización a través de divisiones geográficas (R = 0.92-0.99), estableciendo una plataforma confiable de apoyo a la decisión para sistemas de alerta temprana de calidad del aire adaptativos a nivel regional. Este marco metodológico proporciona valiosas ideas para abordar la heterogeneidad espacial en aplicaciones de modelado ambiental.