Minería de patrones gradual en paralelo de múltiples núcleos basada en ordenamientos difusos de múltiple precisión
Autores: Sicard, Nicolas; Aryadinata, Yogi Satrya; Del Razo Lopez, Federico; Laurent, Anne; Quintero Flores, Perfecto Malaquias
Idioma: Inglés
Editor: MDPI
Año: 2013
Acceso abierto
Artículo científico
2013
Minería de patrones gradual en paralelo de múltiples núcleos basada en ordenamientos difusos de múltiple precisión
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Patrones graduales
Minería de datos
Ordenamientos eficientes
Ordenamientos difusos
Expresión génica
Matrices de múltiple precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Los patrones graduales tienen como objetivo describir las co-variaciones de los datos. En los últimos años, dichos patrones han sido estudiados cada vez más desde el punto de vista de la minería de datos. La extracción de tales patrones se basa en ordenamientos eficientes e inteligentes que pueden construirse entre los datos, por ejemplo, al ordenar los datos con respecto al tamaño, entonces los datos también se ordenan con respecto al peso. Sin embargo, en muchos dominios de aplicación, es difícil considerar que los valores de los datos están ordenados de forma nítida. Al considerar la expresión génica, no es cierto desde el punto de vista biológico que el Gen 1 esté más expresado que el Gen 2, si los niveles de expresión solo difieren en la décima decimal. Por lo tanto, consideramos ordenamientos difusos. En este artículo, abordamos dos problemas principales relacionados con este marco: (i) el alto consumo de memoria y (ii) la precisión, representación y almacenamiento eficiente de los grados de concordancia difusa frente a la pérdida o ganancia de potencia de cálculo. Con este fin, consideramos matrices de precisión múltiple representadas utilizando matrices dispersas junto con algoritmos paralelos. Los resultados experimentales muestran el interés de nuestra propuesta.
Descripción
Los patrones graduales tienen como objetivo describir las co-variaciones de los datos. En los últimos años, dichos patrones han sido estudiados cada vez más desde el punto de vista de la minería de datos. La extracción de tales patrones se basa en ordenamientos eficientes e inteligentes que pueden construirse entre los datos, por ejemplo, al ordenar los datos con respecto al tamaño, entonces los datos también se ordenan con respecto al peso. Sin embargo, en muchos dominios de aplicación, es difícil considerar que los valores de los datos están ordenados de forma nítida. Al considerar la expresión génica, no es cierto desde el punto de vista biológico que el Gen 1 esté más expresado que el Gen 2, si los niveles de expresión solo difieren en la décima decimal. Por lo tanto, consideramos ordenamientos difusos. En este artículo, abordamos dos problemas principales relacionados con este marco: (i) el alto consumo de memoria y (ii) la precisión, representación y almacenamiento eficiente de los grados de concordancia difusa frente a la pérdida o ganancia de potencia de cálculo. Con este fin, consideramos matrices de precisión múltiple representadas utilizando matrices dispersas junto con algoritmos paralelos. Los resultados experimentales muestran el interés de nuestra propuesta.