Predicción de la concentración de PM en Malasia utilizando un modelo híbrido de K-Means Clustering y LSTM
Autores: Ariff, Noratiqah Mohd; Bakar, Mohd Aftar Abu; Lim, Han Ying
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Predicción de la concentración de PM en Malasia utilizando un modelo híbrido de K-Means Clustering y LSTM
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Sectores industriales
Contaminación del aire
Malasia
Material particulado
PM
Modelo híbrido
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 6
Citaciones: Sin citaciones
Siguiendo el rápido desarrollo de varios sectores industriales, la contaminación del aire ocurre con frecuencia en todos los rincones del mundo. Como un contaminante dominante en Malasia, las partículas PM pueden causar efectos altamente perjudiciales para la salud humana. Este estudio tiene como objetivo predecir la concentración promedio diaria de PM basada en los datos recopilados de 60 estaciones de monitoreo de calidad del aire en Malasia. Construir un modelo de pronóstico para cada estación es un proceso que consume mucho tiempo y es poco realista; por lo tanto, se propone un modelo híbrido que combina la técnica de agrupamiento k-means y el modelo de memoria a corto y largo plazo (LSTM) para reducir el número de modelos y el tiempo total de entrenamiento del modelo. Basado en el conjunto de entrenamiento, las estaciones fueron agrupadas utilizando el algoritmo k-means y se construyó un modelo LSTM para cada grupo. Luego, se comparó el rendimiento de predicción del modelo híbrido con el modelo LSTM univariado construido de forma independiente para cada estación. Los resultados muestran que el modelo híbrido tiene un rendimiento de predicción comparable al del modelo LSTM univariado, ya que presenta una diferencia porcentual relativa (RPD) menor o igual al 50% basada en al menos dos métricas de precisión para 43 estaciones. El modelo híbrido también puede ajustarse bien a la tendencia de los datos reales con un tiempo de entrenamiento mucho más corto. Por lo tanto, el modelo híbrido es más competitivo y adecuado para aplicaciones reales de pronóstico de la calidad del aire.
Descripción
Siguiendo el rápido desarrollo de varios sectores industriales, la contaminación del aire ocurre con frecuencia en todos los rincones del mundo. Como un contaminante dominante en Malasia, las partículas PM pueden causar efectos altamente perjudiciales para la salud humana. Este estudio tiene como objetivo predecir la concentración promedio diaria de PM basada en los datos recopilados de 60 estaciones de monitoreo de calidad del aire en Malasia. Construir un modelo de pronóstico para cada estación es un proceso que consume mucho tiempo y es poco realista; por lo tanto, se propone un modelo híbrido que combina la técnica de agrupamiento k-means y el modelo de memoria a corto y largo plazo (LSTM) para reducir el número de modelos y el tiempo total de entrenamiento del modelo. Basado en el conjunto de entrenamiento, las estaciones fueron agrupadas utilizando el algoritmo k-means y se construyó un modelo LSTM para cada grupo. Luego, se comparó el rendimiento de predicción del modelo híbrido con el modelo LSTM univariado construido de forma independiente para cada estación. Los resultados muestran que el modelo híbrido tiene un rendimiento de predicción comparable al del modelo LSTM univariado, ya que presenta una diferencia porcentual relativa (RPD) menor o igual al 50% basada en al menos dos métricas de precisión para 43 estaciones. El modelo híbrido también puede ajustarse bien a la tendencia de los datos reales con un tiempo de entrenamiento mucho más corto. Por lo tanto, el modelo híbrido es más competitivo y adecuado para aplicaciones reales de pronóstico de la calidad del aire.