Un enfoque de aprendizaje automático para la predicción de la calidad del aire: regularización y optimización del modelo
Autores: Zhu, Dixian; Cai, Changjie; Yang, Tianbao; Zhou, Xun
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Un enfoque de aprendizaje automático para la predicción de la calidad del aire: regularización y optimización del modelo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Pronóstico de calidad del aire
Enfoques de aprendizaje automático
Contaminantes atmosféricos
Dióxido de azufre
Modelos de predicción
Aprendizaje multitarea
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 69
Citaciones: Sin citaciones
En este trabajo, abordamos la predicción de la calidad del aire utilizando enfoques de aprendizaje automático para predecir la concentración horaria de contaminantes atmosféricos (por ejemplo, ozono, materia particulada y dióxido de azufre). El aprendizaje automático, como una de las técnicas más populares, es capaz de entrenar eficientemente un modelo en grandes volúmenes de datos mediante el uso de algoritmos de optimización a gran escala. Aunque existen algunos trabajos que aplican el aprendizaje automático a la predicción de la calidad del aire, la mayoría de los estudios previos se limitan a datos de varios años y simplemente entrenan modelos de regresión estándar (lineales o no lineales) para predecir la concentración horaria de contaminación del aire. En este trabajo, proponemos modelos refinados para predecir la concentración horaria de contaminación del aire en función de datos meteorológicos de días anteriores formulando la predicción durante 24 horas como un problema de aprendizaje multitarea (MTL). Esto nos permite seleccionar un buen modelo con diferentes técnicas de regularización. Proponemos una regularización útil al obligar que los modelos de predicción de horas consecutivas estén cerca uno del otro y lo comparamos con varias regularizaciones típicas para MTL, incluida la regularización de la norma de Frobenius estándar, la regularización de la norma nuclear y la regularización de la norma L1. Nuestros experimentos han mostrado que las formulaciones propuestas para reducir parámetros y las regularizaciones relacionadas con horas consecutivas logran un mejor rendimiento que los modelos de regresión estándar existentes y las regularizaciones existentes.
Descripción
En este trabajo, abordamos la predicción de la calidad del aire utilizando enfoques de aprendizaje automático para predecir la concentración horaria de contaminantes atmosféricos (por ejemplo, ozono, materia particulada y dióxido de azufre). El aprendizaje automático, como una de las técnicas más populares, es capaz de entrenar eficientemente un modelo en grandes volúmenes de datos mediante el uso de algoritmos de optimización a gran escala. Aunque existen algunos trabajos que aplican el aprendizaje automático a la predicción de la calidad del aire, la mayoría de los estudios previos se limitan a datos de varios años y simplemente entrenan modelos de regresión estándar (lineales o no lineales) para predecir la concentración horaria de contaminación del aire. En este trabajo, proponemos modelos refinados para predecir la concentración horaria de contaminación del aire en función de datos meteorológicos de días anteriores formulando la predicción durante 24 horas como un problema de aprendizaje multitarea (MTL). Esto nos permite seleccionar un buen modelo con diferentes técnicas de regularización. Proponemos una regularización útil al obligar que los modelos de predicción de horas consecutivas estén cerca uno del otro y lo comparamos con varias regularizaciones típicas para MTL, incluida la regularización de la norma de Frobenius estándar, la regularización de la norma nuclear y la regularización de la norma L1. Nuestros experimentos han mostrado que las formulaciones propuestas para reducir parámetros y las regularizaciones relacionadas con horas consecutivas logran un mejor rendimiento que los modelos de regresión estándar existentes y las regularizaciones existentes.