Agrupación ponderada de muestra local con difusión de gráficos de alto orden
Autores: Gan, Jianwen; Liang, Yunhui; Du, Liang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Agrupación ponderada de muestra local con difusión de gráficos de alto orden
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Método de conjunto de agrupamiento
Métodos basados en matrices de similitud
Métodos basados en grafos
Matrices de similitud confiables
Difusión de grafos
Agrupamiento ponderado de muestras locales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
El método de conjunto de agrupamiento ha atraído mucha atención porque puede mejorar la estabilidad y robustez de los métodos de agrupamiento individuales. Entre ellos, los métodos basados en matrices de similitud o métodos basados en grafos han tenido una amplia gama de aplicaciones en los últimos años. La mayoría de los métodos basados en matrices de similitud calculan similitudes emparejadas completamente conectadas tratando un clúster base como un todo e ignorando la importancia de la clasificación de relevancia de las muestras dentro del mismo clúster base. Dado que las estimaciones de similitud poco fiables degradan el rendimiento del agrupamiento, la construcción de matrices de similitud precisas es de gran importancia en las aplicaciones. La difusión de grafos de orden superior basada en matrices de similitud confiables puede revelar conexiones potenciales entre los datos. En este documento, proponemos un algoritmo de conjunto basado en aprendizaje de grafos más sustancial para el agrupamiento ponderado de muestras locales, que optimiza implícitamente los pesos adaptativos de diferentes vecindarios basados en la importancia de clasificación de diferentes vecinos. Mediante una mayor difusión en la matriz de consenso, obtuvimos una matriz de consistencia óptima con un poder discriminativo más sustancial, revelando la relación de similitud potencial entre las muestras. Los resultados experimentales mostraron que, en comparación con el segundo mejor algoritmo DREC, la precisión del algoritmo propuesto mejoró en un 17,7%, y la del algoritmo de información mutua normalizada (NMI) mejoró en un 15,88%. Todos los resultados empíricos mostraron que nuestro modelo de agrupamiento superó consistentemente a los métodos de agrupamiento relacionados.
Descripción
El método de conjunto de agrupamiento ha atraído mucha atención porque puede mejorar la estabilidad y robustez de los métodos de agrupamiento individuales. Entre ellos, los métodos basados en matrices de similitud o métodos basados en grafos han tenido una amplia gama de aplicaciones en los últimos años. La mayoría de los métodos basados en matrices de similitud calculan similitudes emparejadas completamente conectadas tratando un clúster base como un todo e ignorando la importancia de la clasificación de relevancia de las muestras dentro del mismo clúster base. Dado que las estimaciones de similitud poco fiables degradan el rendimiento del agrupamiento, la construcción de matrices de similitud precisas es de gran importancia en las aplicaciones. La difusión de grafos de orden superior basada en matrices de similitud confiables puede revelar conexiones potenciales entre los datos. En este documento, proponemos un algoritmo de conjunto basado en aprendizaje de grafos más sustancial para el agrupamiento ponderado de muestras locales, que optimiza implícitamente los pesos adaptativos de diferentes vecindarios basados en la importancia de clasificación de diferentes vecinos. Mediante una mayor difusión en la matriz de consenso, obtuvimos una matriz de consistencia óptima con un poder discriminativo más sustancial, revelando la relación de similitud potencial entre las muestras. Los resultados experimentales mostraron que, en comparación con el segundo mejor algoritmo DREC, la precisión del algoritmo propuesto mejoró en un 17,7%, y la del algoritmo de información mutua normalizada (NMI) mejoró en un 15,88%. Todos los resultados empíricos mostraron que nuestro modelo de agrupamiento superó consistentemente a los métodos de agrupamiento relacionados.