Aprendizaje automático impulsado por Big Data para mejorar el análisis de patrones de contaminación del aire espaciotemporales
Autores: Zareba, Mateusz; Dlugosz, Hubert; Danek, Tomasz; Weglinska, Elzbieta
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje automático impulsado por Big Data para mejorar el análisis de patrones de contaminación del aire espaciotemporales
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Contaminación del aire
Análisis espaciotemporal
Algoritmos de aprendizaje automático
Desafío de grandes datos
Sensores
Concentraciones de contaminantes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 11
Citaciones: Sin citaciones
La contaminación del aire es un problema importante para la salud pública. El análisis espaciotemporal es un paso crucial para entender las características complejas de la contaminación del aire. Utilizar muchos sensores y observaciones de alta resolución en intervalos de tiempo convierte esta tarea en un desafío de grandes datos. En este estudio, se aplicaron algoritmos de aprendizaje automático no supervisado para analizar patrones espaciotemporales de la contaminación del aire. El análisis se realizó utilizando grandes datos de PM10 recopilados de casi 100 sensores ubicados en Cracovia, durante un período de un año, con datos registrados en intervalos de 1 hora. Los resultados del análisis utilizando agrupamiento K-means y SKATER revelaron diferencias distintas entre los valores promedio y máximos de las concentraciones de contaminantes. El estudio encontró que el algoritmo K-means con Dynamic Time Warping (DTW) fue más preciso en la identificación de patrones anuales y agrupamiento en datos que varían rápidamente y espacialmente, en comparación con el algoritmo SKATER. Además, el análisis de agrupamiento de datos después de la kriging facilitó en gran medida la interpretación de los resultados. Estos hallazgos destacan el potencial de las técnicas de aprendizaje automático y el análisis de grandes datos para identificar puntos críticos, puntos fríos y patrones de contaminación del aire, así como para informar decisiones políticas relacionadas con la planificación urbana, la gestión del tráfico y las intervenciones en salud pública.
Descripción
La contaminación del aire es un problema importante para la salud pública. El análisis espaciotemporal es un paso crucial para entender las características complejas de la contaminación del aire. Utilizar muchos sensores y observaciones de alta resolución en intervalos de tiempo convierte esta tarea en un desafío de grandes datos. En este estudio, se aplicaron algoritmos de aprendizaje automático no supervisado para analizar patrones espaciotemporales de la contaminación del aire. El análisis se realizó utilizando grandes datos de PM10 recopilados de casi 100 sensores ubicados en Cracovia, durante un período de un año, con datos registrados en intervalos de 1 hora. Los resultados del análisis utilizando agrupamiento K-means y SKATER revelaron diferencias distintas entre los valores promedio y máximos de las concentraciones de contaminantes. El estudio encontró que el algoritmo K-means con Dynamic Time Warping (DTW) fue más preciso en la identificación de patrones anuales y agrupamiento en datos que varían rápidamente y espacialmente, en comparación con el algoritmo SKATER. Además, el análisis de agrupamiento de datos después de la kriging facilitó en gran medida la interpretación de los resultados. Estos hallazgos destacan el potencial de las técnicas de aprendizaje automático y el análisis de grandes datos para identificar puntos críticos, puntos fríos y patrones de contaminación del aire, así como para informar decisiones políticas relacionadas con la planificación urbana, la gestión del tráfico y las intervenciones en salud pública.