Métodos de aprendizaje automático en datos ruidosos y dispersos
Autores: Poulinakis, Konstantinos; Drikakis, Dimitris; Kokkinakis, Ioannis W.; Spottswood, Stephen Michael
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Métodos de aprendizaje automático en datos ruidosos y dispersos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos experimentales
Datos computacionales
Datos de campo
Métodos de aprendizaje automático
Splines cúbicos
Datos de entrenamiento.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Los datos experimentales y computacionales y los datos de campo obtenidos de mediciones suelen ser escasos y ruidosos. En consecuencia, interpolar funciones desconocidas bajo estas restricciones para proporcionar predicciones precisas es muy desafiante. Este estudio compara métodos de aprendizaje automático y splines cúbicos sobre la cantidad de datos de entrenamiento escasos que pueden manejar, especialmente cuando las muestras de entrenamiento son ruidosas. Comparamos la desviación de una función verdadera utilizando el error cuadrático medio, la relación señal-ruido y el coeficiente de Pearson. Mostramos que, dados datos muy escasos, los splines cúbicos constituyen un método de interpolación más preciso que las redes neuronales profundas y los splines de regresión adaptativa multivariable. En contraste, los modelos de aprendizaje automático son robustos al ruido y pueden superar a los splines después de que se cumple un umbral de datos de entrenamiento. Nuestro estudio tiene como objetivo proporcionar un marco general para interpolar señales unidimensionales, a menudo resultado de simulaciones científicas complejas o experimentos de laboratorio.
Descripción
Los datos experimentales y computacionales y los datos de campo obtenidos de mediciones suelen ser escasos y ruidosos. En consecuencia, interpolar funciones desconocidas bajo estas restricciones para proporcionar predicciones precisas es muy desafiante. Este estudio compara métodos de aprendizaje automático y splines cúbicos sobre la cantidad de datos de entrenamiento escasos que pueden manejar, especialmente cuando las muestras de entrenamiento son ruidosas. Comparamos la desviación de una función verdadera utilizando el error cuadrático medio, la relación señal-ruido y el coeficiente de Pearson. Mostramos que, dados datos muy escasos, los splines cúbicos constituyen un método de interpolación más preciso que las redes neuronales profundas y los splines de regresión adaptativa multivariable. En contraste, los modelos de aprendizaje automático son robustos al ruido y pueden superar a los splines después de que se cumple un umbral de datos de entrenamiento. Nuestro estudio tiene como objetivo proporcionar un marco general para interpolar señales unidimensionales, a menudo resultado de simulaciones científicas complejas o experimentos de laboratorio.