Una comparación de enfoques basados en aprendizaje automático en la estimación de concentraciones de PM en la superficie, centrándose en redes neuronales artificiales y eventos de alta contaminación
Autores: Wei, Shijin; Shores, Kyle; Xu, Yangyang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Una comparación de enfoques basados en aprendizaje automático en la estimación de concentraciones de PM en la superficie, centrándose en redes neuronales artificiales y eventos de alta contaminación
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Modelos de aprendizaje automático
Concentraciones de pm
Anns
Selecciones de características
Nnse
Análisis de sensibilidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 13
Citaciones: Sin citaciones
Las concentraciones de PM en la superficie tienen implicaciones significativas para la salud humana, lo que requiere estimaciones precisas. Este estudio compara varios modelos de aprendizaje automático, incluidos modelos lineales, algoritmos basados en árboles y redes neuronales artificiales (ANN) para estimar las concentraciones de PM utilizando el conjunto de datos MERRA-2 de 2012 a 2023. Se utilizan la información mutua y las puntuaciones de correlación cruzada de Spearman durante la selección de características. El rendimiento de los modelos se evalúa utilizando métricas que incluyen la eficiencia normalizada de Nash-Sutcliffe (NNSE), la relación de desviación estándar de la raíz (RSR) y el error porcentual medio (MPE). Nuestros resultados muestran que las ANN superan a los modelos lineales y basados en árboles, particularmente en la estimación de concentraciones diarias de PM de 35-1000 ug/m. Las ANN mejoran el NNSE en un 119% y un 46%, el RSR en un 40% y un 24%, y el MPE en un 44% y un 30% en comparación con los modelos lineales y basados en árboles, respectivamente, lo que indica un rendimiento superior de estimación de las ANN durante los días de alta contaminación. El análisis de sensibilidad de las características que interpretan los modelos sugiere que la extinción total del AOD a 550 nm y las concentraciones de CO en la superficie son las características más importantes en el oeste y este de EE. UU., respectivamente. Los hallazgos sugieren que incluso las NNs más simples proporcionan mejores estimaciones de calidad del aire, especialmente durante eventos de alta contaminación, lo que es beneficioso para el análisis de exposición a largo plazo. La investigación futura debería explorar arquitecturas de NN más sofisticadas con variaciones espaciales y temporales en PM para mejorar el rendimiento del modelo.
Descripción
Las concentraciones de PM en la superficie tienen implicaciones significativas para la salud humana, lo que requiere estimaciones precisas. Este estudio compara varios modelos de aprendizaje automático, incluidos modelos lineales, algoritmos basados en árboles y redes neuronales artificiales (ANN) para estimar las concentraciones de PM utilizando el conjunto de datos MERRA-2 de 2012 a 2023. Se utilizan la información mutua y las puntuaciones de correlación cruzada de Spearman durante la selección de características. El rendimiento de los modelos se evalúa utilizando métricas que incluyen la eficiencia normalizada de Nash-Sutcliffe (NNSE), la relación de desviación estándar de la raíz (RSR) y el error porcentual medio (MPE). Nuestros resultados muestran que las ANN superan a los modelos lineales y basados en árboles, particularmente en la estimación de concentraciones diarias de PM de 35-1000 ug/m. Las ANN mejoran el NNSE en un 119% y un 46%, el RSR en un 40% y un 24%, y el MPE en un 44% y un 30% en comparación con los modelos lineales y basados en árboles, respectivamente, lo que indica un rendimiento superior de estimación de las ANN durante los días de alta contaminación. El análisis de sensibilidad de las características que interpretan los modelos sugiere que la extinción total del AOD a 550 nm y las concentraciones de CO en la superficie son las características más importantes en el oeste y este de EE. UU., respectivamente. Los hallazgos sugieren que incluso las NNs más simples proporcionan mejores estimaciones de calidad del aire, especialmente durante eventos de alta contaminación, lo que es beneficioso para el análisis de exposición a largo plazo. La investigación futura debería explorar arquitecturas de NN más sofisticadas con variaciones espaciales y temporales en PM para mejorar el rendimiento del modelo.