logo móvil
Contáctanos

Co-Entrenamiento de Aprendizaje Semi-Supervisado para Análisis de Calidad del Aire de Grano Fino

Autores: Zhao, Yaning; Wang, Li; Zhang, Nannan; Huang, Xiangwei; Yang, Lunke; Yang, Wenbiao

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Co-Entrenamiento de Aprendizaje Semi-Supervisado para Análisis de Calidad del Aire de Grano Fino


Categoría

Ciencias Naturales y Subdisciplinas

Subcategoría

Astronomía

Palabras clave

Estaciones de monitoreo de calidad del aire
Aprendizaje supervisado
Sobreajuste
Aprendizaje semi-supervisado
Vecinos más cercanos
Red neuronal profunda

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 9

Citaciones: Sin citaciones


Descripción
Debido al número limitado de estaciones de monitoreo de calidad del aire, los datos recopilados son limitados. Utilizar aprendizaje supervisado para un análisis detallado de la calidad del aire, que se utiliza para predecir el índice de calidad del aire (AQI) de las ubicaciones sin estaciones de monitoreo de calidad del aire, puede llevar a un sobreajuste, ya que los modelos tienen un rendimiento superior en el conjunto de entrenamiento pero rinden mal en el conjunto de validación y prueba. Para evitar este problema en el aprendizaje supervisado, la solución más efectiva es aumentar la cantidad de datos, pero en este estudio, esto no es realista. Afortunadamente, el aprendizaje semi-supervisado puede obtener conocimiento de muestras no etiquetadas, resolviendo así el problema causado por la insuficiencia de muestras de entrenamiento. Por lo tanto, se propone un método de aprendizaje semi-supervisado de co-entrenamiento que combina el algoritmo de K-vecinos más cercanos (KNN) y la red neuronal profunda (DNN), llamado KNN-DNN, que hace un uso completo de las muestras no etiquetadas para mejorar el rendimiento del modelo en el análisis detallado de la calidad del aire. La temperatura, la humedad, las concentraciones de contaminantes y el tipo de fuente se utilizan como variables de entrada, y el algoritmo KNN y el modelo DNN se utilizan como aprendices. Para cada aprendiz, los datos etiquetados se utilizan como el conjunto de entrenamiento inicial para modelar la relación entre las variables de entrada y el AQI. En el proceso iterativo, al etiquetar las muestras no etiquetadas, se selecciona una pseudo-muestra con la mayor confianza para ampliar el conjunto de entrenamiento. El modelo propuesto se evalúa en un conjunto de datos real recopilado por estaciones de monitoreo desde el 1 de febrero hasta el 30 de abril de 2018 en una región entre 118 grados E-118 grados 53 E y 39 grados 45 N-39 grados 89 N. La aplicación práctica muestra que el modelo propuesto tiene un efecto significativo en el análisis detallado de la calidad del aire. El coeficiente de determinación entre el valor predicho y el valor verdadero es 0.97, lo que es mejor que otros modelos.

Otros recursos que podrían interesarte

Temas Virtualpro