Reconstruyendo el Registro de Datos de PM para el Valle de Katmandú Utilizando un Modelo de Aprendizaje Automático
Autores: Bhatta, Surendra; Yang, Yuekui
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reconstruyendo el Registro de Datos de PM para el Valle de Katmandú Utilizando un Modelo de Aprendizaje Automático
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Método
Concentraciones horarias históricas
Material Particulado 2.5
Valle de Katmandú
Modelo de aprendizaje automático
Aumento Extremo de Gradiente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 7
Citaciones: Sin citaciones
Este documento presenta un método para reconstruir las concentraciones horarias históricas de Material Particulado 2.5 (PM) en el Valle de Katmandú desde 1980 hasta el presente. El método utiliza un modelo de aprendizaje automático que se entrena utilizando lecturas de PM de la Embajada de EE. UU. (Phora Durbar) como verdad de referencia, y los datos meteorológicos del Análisis Retrospectivo de la Era Moderna para la Investigación y Aplicaciones v2 (MERRA2) como entrada. El modelo de Extreme Gradient Boosting (XGBoost) obtiene un puntaje de validación cruzada (CV) creíble de ~83.4%, un puntaje r2 de ~84%, un Error Cuadrático Medio (RMSE) de ~15.82 ug/m, y un Error Absoluto Medio (MAE) de ~10.27 ug/m. Al demostrar aún más la aplicabilidad del modelo a años distintos de aquellos para los cuales no hay valores de verdad disponibles, las múltiples pruebas cruzadas con un conjunto de datos no visto ofrecieron puntajes r2 para 2018, 2019 y 2020 que oscilan entre el 56% y el 67%. Los datos predichos por el modelo coinciden con los valores reales e indican que MERRA2 subestima el PM en la región. Coincide fuertemente con la evidencia basada en el suelo que muestra concentraciones de masa sustancialmente más altas en las estaciones secas antes y después del monzón que en los meses de monzón. También muestra una fuerte anti-correlación entre la concentración de PM y la humedad. Los resultados también demuestran que ninguno de los años cumplió con los estándares del índice de calidad del aire (AQI) anuales establecidos por la Organización Mundial de la Salud (OMS).
Descripción
Este documento presenta un método para reconstruir las concentraciones horarias históricas de Material Particulado 2.5 (PM) en el Valle de Katmandú desde 1980 hasta el presente. El método utiliza un modelo de aprendizaje automático que se entrena utilizando lecturas de PM de la Embajada de EE. UU. (Phora Durbar) como verdad de referencia, y los datos meteorológicos del Análisis Retrospectivo de la Era Moderna para la Investigación y Aplicaciones v2 (MERRA2) como entrada. El modelo de Extreme Gradient Boosting (XGBoost) obtiene un puntaje de validación cruzada (CV) creíble de ~83.4%, un puntaje r2 de ~84%, un Error Cuadrático Medio (RMSE) de ~15.82 ug/m, y un Error Absoluto Medio (MAE) de ~10.27 ug/m. Al demostrar aún más la aplicabilidad del modelo a años distintos de aquellos para los cuales no hay valores de verdad disponibles, las múltiples pruebas cruzadas con un conjunto de datos no visto ofrecieron puntajes r2 para 2018, 2019 y 2020 que oscilan entre el 56% y el 67%. Los datos predichos por el modelo coinciden con los valores reales e indican que MERRA2 subestima el PM en la región. Coincide fuertemente con la evidencia basada en el suelo que muestra concentraciones de masa sustancialmente más altas en las estaciones secas antes y después del monzón que en los meses de monzón. También muestra una fuerte anti-correlación entre la concentración de PM y la humedad. Los resultados también demuestran que ninguno de los años cumplió con los estándares del índice de calidad del aire (AQI) anuales establecidos por la Organización Mundial de la Salud (OMS).