logo móvil
Contáctanos

Avanzando en la Aseguramiento de la Calidad de los Datos con Aprendizaje Automático: Un Estudio de Caso sobre la Detección de Fallos en Veletas de Viento

Autores: de Feiter, Vincent S.; Strickland, Jessica M. I.; Garcia-Marti, Irene

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Avanzando en la Aseguramiento de la Calidad de los Datos con Aprendizaje Automático: Un Estudio de Caso sobre la Detección de Fallos en Veletas de Viento


Categoría

Ciencias Naturales y Subdisciplinas

Subcategoría

Astronomía

Palabras clave

Conjuntos de datos observacionales
Investigación climática
Aprendizaje automático
Mediciones meteorológicas
Control de calidad
Veleta

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 9

Citaciones: Sin citaciones


Descripción
Los conjuntos de datos observacionales de alta calidad son esenciales para la investigación y los modelos climáticos, pero validar y filtrar décadas de mediciones meteorológicas es una tarea enorme. Los avances en el aprendizaje automático ofrecen oportunidades para acelerar y mejorar el control de calidad, al tiempo que proporcionan información sobre las interacciones no lineales entre las variables meteorológicas. El Sitio Experimental de Cabauw para la Investigación Atmosférica en los Países Bajos, conocido por su mástil de observación de 213 m, ha proporcionado observaciones in situ durante más de 50 años. A pesar de la instrumentación de alta calidad, los errores de medición o los datos no representativos son inevitables. Exploramos el control de calidad asistido por aprendizaje automático, centrándonos en el estancamiento del anemómetro a 10 m de altura. El estancamiento del anemómetro se trata como un problema de clasificación binaria mientras evaluamos cinco métodos supervisados (Regresión Logística, K-Vecinos Más Cercanos, Bosque Aleatorio, Naive Bayes Gaussiano, Máquina de Vectores de Soporte) y un método semi-supervisado (Máquina de Vectores de Soporte de Una Clase). Nuestro análisis determina que el estancamiento del anemómetro ocurrió el 4.54% del tiempo anualmente durante 20 años, a menudo durante condiciones nocturnas estratificadas de manera estable. Los métodos K-Vecinos Más Cercanos y Bosque Aleatorio fueron los que mejor rendimiento tuvieron, identificando el estancamiento con aproximadamente un 75% de precisión, mientras que otros se vieron más afectados por el desequilibrio de datos (más puntos de datos sin estancamiento que con estancamiento). El método semi-supervisado, al evitar los efectos del desequilibrio de datos inherente, también arrojó resultados prometedores para avanzar en la garantía de calidad de los datos.

Otros recursos que podrían interesarte

Temas Virtualpro