Nueva modelo híbrido de aprendizaje profundo MIA-LSTM con preprocesamiento de datos para pronóstico de PM
Autores: Narkhede, Gaurav; Hiwale, Anil; Tidke, Bharat; Khadse, Chetan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Nueva modelo híbrido de aprendizaje profundo MIA-LSTM con preprocesamiento de datos para pronóstico de PM
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Contaminación
Urbanización
Objetivo de Desarrollo Sostenible 11
Contaminantes atmosféricos
Imputación
Valores atípicos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 48
Citaciones: Sin citaciones
Día a día la contaminación en las ciudades está aumentando debido a la urbanización. Uno de los mayores desafíos planteados por la migración rápida de habitantes a las ciudades es el aumento de la contaminación del aire. El Objetivo de Desarrollo Sostenible 11 indica que el 99 por ciento de la población urbana mundial respira aire contaminado. En esa tendencia de urbanización, predecir las concentraciones de contaminantes con anticipación es muy importante. Las predicciones de contaminantes ayudarían a las administraciones de la ciudad a tomar medidas oportunas para garantizar el Objetivo de Desarrollo Sostenible 11. En ingeniería de datos, la imputación y la eliminación de valores atípicos son pasos muy importantes antes de pronosticar la concentración de contaminantes atmosféricos. Para los datos de contaminación y meteorológicos, los valores faltantes y los valores atípicos son problemas críticos que deben abordarse. Este artículo propone un método novedoso llamado imputación iterativa múltiple utilizando memoria a corto y largo plazo basada en autoencoder (MIA-LSTM) que utiliza imputación iterativa utilizando un regresor de árbol adicional como estimador para los valores faltantes en datos multivariados seguido por un autoencoder LSTM para la detección y eliminación de valores atípicos presentes en el conjunto de datos. Los datos preprocesados se dieron a un LSTM multivariado para pronosticar la concentración de PM. Este artículo también presenta el efecto de eliminar valores atípicos y valores faltantes del conjunto de datos, así como el efecto de imputar valores faltantes en el proceso de pronosticar las concentraciones de contaminantes atmosféricos. El método propuesto proporciona mejores resultados para el pronóstico con un valor de error cuadrático medio (RMSE) de 9.8883. Los resultados obtenidos se compararon con las aproximaciones tradicionales de unidad recurrente cerrada (GRU), red neuronal convolucional 1D (CNN) y memoria a corto y largo plazo (LSTM) para un conjunto de datos del área de Aotizhonhxin en Beijing, China. Se observaron resultados similares para otras dos ubicaciones en China y una ubicación en India. Los resultados obtenidos muestran que la imputación y la eliminación de valores atípicos/anómalos mejoran la precisión del pronóstico de la contaminación del aire.
Descripción
Día a día la contaminación en las ciudades está aumentando debido a la urbanización. Uno de los mayores desafíos planteados por la migración rápida de habitantes a las ciudades es el aumento de la contaminación del aire. El Objetivo de Desarrollo Sostenible 11 indica que el 99 por ciento de la población urbana mundial respira aire contaminado. En esa tendencia de urbanización, predecir las concentraciones de contaminantes con anticipación es muy importante. Las predicciones de contaminantes ayudarían a las administraciones de la ciudad a tomar medidas oportunas para garantizar el Objetivo de Desarrollo Sostenible 11. En ingeniería de datos, la imputación y la eliminación de valores atípicos son pasos muy importantes antes de pronosticar la concentración de contaminantes atmosféricos. Para los datos de contaminación y meteorológicos, los valores faltantes y los valores atípicos son problemas críticos que deben abordarse. Este artículo propone un método novedoso llamado imputación iterativa múltiple utilizando memoria a corto y largo plazo basada en autoencoder (MIA-LSTM) que utiliza imputación iterativa utilizando un regresor de árbol adicional como estimador para los valores faltantes en datos multivariados seguido por un autoencoder LSTM para la detección y eliminación de valores atípicos presentes en el conjunto de datos. Los datos preprocesados se dieron a un LSTM multivariado para pronosticar la concentración de PM. Este artículo también presenta el efecto de eliminar valores atípicos y valores faltantes del conjunto de datos, así como el efecto de imputar valores faltantes en el proceso de pronosticar las concentraciones de contaminantes atmosféricos. El método propuesto proporciona mejores resultados para el pronóstico con un valor de error cuadrático medio (RMSE) de 9.8883. Los resultados obtenidos se compararon con las aproximaciones tradicionales de unidad recurrente cerrada (GRU), red neuronal convolucional 1D (CNN) y memoria a corto y largo plazo (LSTM) para un conjunto de datos del área de Aotizhonhxin en Beijing, China. Se observaron resultados similares para otras dos ubicaciones en China y una ubicación en India. Los resultados obtenidos muestran que la imputación y la eliminación de valores atípicos/anómalos mejoran la precisión del pronóstico de la contaminación del aire.