Un modelo de regresión lineal por partes para el ajuste de curvas a gran escala
Autores: Moreno-Carbonell, Santiago; Sánchez-Úbeda, Eugenio F.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo de regresión lineal por partes para el ajuste de curvas a gran escala
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Modelo de bisagras lineales
Ajuste de curva unidimensional
Condiciones de alto ruido
Conjuntos de datos a gran escala
Alternativas de conjunto
Modelo de regresión lineal por partes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
El Modelo de Bisagras Lineales (LHM) es un enfoque eficiente para el ajuste de curvas unidimensionales flexibles y robustas bajo condiciones estrictas de alto ruido. Sin embargo, fue diseñado inicialmente para ejecutarse en un procesador de un solo núcleo, accediendo a todo el conjunto de datos de entrada. El aumento en los volúmenes de datos, junto con el incremento en las arquitecturas de hardware paralelo y los marcos especializados, ha llevado a un crecimiento en el interés y la necesidad de nuevos algoritmos capaces de manejar conjuntos de datos a gran escala y técnicas para adaptar algoritmos tradicionales de aprendizaje automático a este nuevo paradigma. Este documento presenta varias alternativas de conjunto, basadas en la selección y combinación de modelos, que permiten obtener un modelo de regresión lineal a trozos continuos a partir de conjuntos de datos a gran escala utilizando el algoritmo de aprendizaje del LHM. Nuestros tests empíricos han demostrado que la combinación de modelos supera a la selección de modelos y que estos métodos pueden proporcionar mejores resultados en términos de sesgo, varianza y tiempo de ejecución que el algoritmo original ejecutado sobre todo el conjunto de datos.
Descripción
El Modelo de Bisagras Lineales (LHM) es un enfoque eficiente para el ajuste de curvas unidimensionales flexibles y robustas bajo condiciones estrictas de alto ruido. Sin embargo, fue diseñado inicialmente para ejecutarse en un procesador de un solo núcleo, accediendo a todo el conjunto de datos de entrada. El aumento en los volúmenes de datos, junto con el incremento en las arquitecturas de hardware paralelo y los marcos especializados, ha llevado a un crecimiento en el interés y la necesidad de nuevos algoritmos capaces de manejar conjuntos de datos a gran escala y técnicas para adaptar algoritmos tradicionales de aprendizaje automático a este nuevo paradigma. Este documento presenta varias alternativas de conjunto, basadas en la selección y combinación de modelos, que permiten obtener un modelo de regresión lineal a trozos continuos a partir de conjuntos de datos a gran escala utilizando el algoritmo de aprendizaje del LHM. Nuestros tests empíricos han demostrado que la combinación de modelos supera a la selección de modelos y que estos métodos pueden proporcionar mejores resultados en términos de sesgo, varianza y tiempo de ejecución que el algoritmo original ejecutado sobre todo el conjunto de datos.