Método de imputación basado en aprendizaje automático para rellenar valores faltantes en datos de observación meteorológica terrestre
Autores: Li, Cong; Ren, Xupeng; Zhao, Guohui
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Método de imputación basado en aprendizaje automático para rellenar valores faltantes en datos de observación meteorológica terrestre
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Suelo
Datos de observación meteorológica
Valores faltantes
Imputación
Métodos de aprendizaje automático
Datos multidimensionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Los datos de observación meteorológica en tierra (GMOD) son el núcleo de la investigación en disciplinas relacionadas con la Tierra y una referencia importante para la producción y la vida social. Desafortunadamente, debido a problemas operativos o fallas en el equipo, pueden ocurrir valores faltantes en GMOD. Por lo tanto, la imputación de datos faltantes es un problema prevalente durante el preprocesamiento de GMOD. Aunque se han aplicado numerosos métodos de aprendizaje automático al campo de la imputación de valores faltantes meteorológicos y han logrado buenos resultados, suelen estar dirigidos a elementos meteorológicos específicos, y pocos estudios discuten la imputación cuando múltiples elementos faltan aleatoriamente en el conjunto de datos. Este documento diseñó un marco de imputación de datos meteorológicos multidimensionales basado en aprendizaje automático (MMDIF), que puede utilizar las predicciones de métodos de aprendizaje automático para imputar el GMOD con valores faltantes aleatorios en múltiples atributos, y probó la efectividad de 20 métodos de aprendizaje automático en la imputación de valores faltantes dentro de 124 estaciones meteorológicas en seis regiones climáticas diferentes basadas en el MMDIF. Los resultados muestran que MMDIF-RF fue el método más efectivo de imputación de valores faltantes; es mejor que otros métodos para imputar 11 tipos de elementos meteorológicos por hora. Aunque este documento aplicó MMDIF a la imputación de valores faltantes en datos meteorológicos, el método también puede proporcionar orientación para la reconstrucción de conjuntos de datos en otras industrias.
Descripción
Los datos de observación meteorológica en tierra (GMOD) son el núcleo de la investigación en disciplinas relacionadas con la Tierra y una referencia importante para la producción y la vida social. Desafortunadamente, debido a problemas operativos o fallas en el equipo, pueden ocurrir valores faltantes en GMOD. Por lo tanto, la imputación de datos faltantes es un problema prevalente durante el preprocesamiento de GMOD. Aunque se han aplicado numerosos métodos de aprendizaje automático al campo de la imputación de valores faltantes meteorológicos y han logrado buenos resultados, suelen estar dirigidos a elementos meteorológicos específicos, y pocos estudios discuten la imputación cuando múltiples elementos faltan aleatoriamente en el conjunto de datos. Este documento diseñó un marco de imputación de datos meteorológicos multidimensionales basado en aprendizaje automático (MMDIF), que puede utilizar las predicciones de métodos de aprendizaje automático para imputar el GMOD con valores faltantes aleatorios en múltiples atributos, y probó la efectividad de 20 métodos de aprendizaje automático en la imputación de valores faltantes dentro de 124 estaciones meteorológicas en seis regiones climáticas diferentes basadas en el MMDIF. Los resultados muestran que MMDIF-RF fue el método más efectivo de imputación de valores faltantes; es mejor que otros métodos para imputar 11 tipos de elementos meteorológicos por hora. Aunque este documento aplicó MMDIF a la imputación de valores faltantes en datos meteorológicos, el método también puede proporcionar orientación para la reconstrucción de conjuntos de datos en otras industrias.