Algoritmo de agrupamiento de subespacios de núcleo autoexpresivo para datos categóricos con selección de características incrustada
Autores: Chen, Hui; Xu, Kunpeng; Chen, Lifei; Jiang, Qingshan
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Algoritmo de agrupamiento de subespacios de núcleo autoexpresivo para datos categóricos con selección de características incrustada
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Agrupamiento de núcleo
Datos categóricos
Autoexpresivo
Algoritmo
Optimización no lineal
Medición de similitud
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
La agrupación de núcleos de datos categóricos es una herramienta útil para procesar conjuntos de datos separables y ha sido empleada en muchas disciplinas. A pesar de los esfuerzos recientes, los métodos existentes para la agrupación de núcleos siguen siendo un desafío significativo debido a la suposición de independencia de características y pesos iguales. En este estudio, proponemos un algoritmo de agrupación de subespacios de núcleos autoexpresivos para datos categóricos (SKSCC) utilizando el esquema de estimación de densidad de núcleo autoexpresivo (SKDE), así como una nueva medida de similitud no lineal ponderada por características. En el algoritmo SKSCC, proponemos un método efectivo de optimización no lineal para resolver la función objetivo del algoritmo de agrupación, que no solo considera la relación entre atributos en un espacio no lineal, sino que también asigna un peso a cada atributo en el algoritmo para medir el grado de correlación. Una serie de experimentos en algunos conjuntos de datos sintéticos y del mundo real ampliamente utilizados demostraron la mayor efectividad y eficiencia del algoritmo propuesto en comparación con otros métodos de vanguardia, en términos de exploración de relaciones no lineales entre atributos.
Descripción
La agrupación de núcleos de datos categóricos es una herramienta útil para procesar conjuntos de datos separables y ha sido empleada en muchas disciplinas. A pesar de los esfuerzos recientes, los métodos existentes para la agrupación de núcleos siguen siendo un desafío significativo debido a la suposición de independencia de características y pesos iguales. En este estudio, proponemos un algoritmo de agrupación de subespacios de núcleos autoexpresivos para datos categóricos (SKSCC) utilizando el esquema de estimación de densidad de núcleo autoexpresivo (SKDE), así como una nueva medida de similitud no lineal ponderada por características. En el algoritmo SKSCC, proponemos un método efectivo de optimización no lineal para resolver la función objetivo del algoritmo de agrupación, que no solo considera la relación entre atributos en un espacio no lineal, sino que también asigna un peso a cada atributo en el algoritmo para medir el grado de correlación. Una serie de experimentos en algunos conjuntos de datos sintéticos y del mundo real ampliamente utilizados demostraron la mayor efectividad y eficiencia del algoritmo propuesto en comparación con otros métodos de vanguardia, en términos de exploración de relaciones no lineales entre atributos.