Un enfoque de agrupamiento de tres vías mejorado basado en estrategia de conjunto
Autores: Wu, Tingfeng; Fan, Jiachen; Wang, Pingxin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un enfoque de agrupamiento de tres vías mejorado basado en estrategia de conjunto
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Técnica poderosa de análisis de datos
Agrupamiento
Información de incertidumbre
Estrategia de conjunto
Algoritmo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Como una técnica poderosa de análisis de datos, el agrupamiento juega un papel importante en la minería de datos. El agrupamiento tradicional duro utiliza un conjunto con un límite claro para representar un grupo, lo que no puede resolver el problema de la toma de decisiones inexacta causada por información inexacta o datos insuficientes. Para resolver este problema, se presentó el agrupamiento de tres vías para mostrar la información de incertidumbre en el conjunto de datos añadiendo el concepto de región de borde. En este documento, presentamos un algoritmo de agrupamiento de tres vías mejorado basado en una estrategia de conjunto. A diferencia de los métodos de conjunto de agrupamiento existentes que utilizan varios algoritmos de agrupamiento para producir los resultados de agrupamiento base, el algoritmo propuesto extrae aleatoriamente un subconjunto de características de muestras y utiliza el algoritmo de agrupamiento tradicional para obtener resultados de agrupamiento base diversos. Basándose en los resultados de agrupamiento base, se utiliza el etiquetado para alinear todos los resultados de agrupamiento en un orden dado y se utiliza un método de votación para obtener la región central y la región de borde del agrupamiento de tres vías. El algoritmo propuesto se puede aplicar en la parte superior de cualquier algoritmo de agrupamiento duro existente para generar los resultados de agrupamiento base. Como ejemplos para demostración, aplicamos el algoritmo propuesto en la parte superior de K-means y el agrupamiento espectral, respectivamente. Los resultados experimentales muestran que el algoritmo propuesto es efectivo para revelar estructuras de grupos.
Descripción
Como una técnica poderosa de análisis de datos, el agrupamiento juega un papel importante en la minería de datos. El agrupamiento tradicional duro utiliza un conjunto con un límite claro para representar un grupo, lo que no puede resolver el problema de la toma de decisiones inexacta causada por información inexacta o datos insuficientes. Para resolver este problema, se presentó el agrupamiento de tres vías para mostrar la información de incertidumbre en el conjunto de datos añadiendo el concepto de región de borde. En este documento, presentamos un algoritmo de agrupamiento de tres vías mejorado basado en una estrategia de conjunto. A diferencia de los métodos de conjunto de agrupamiento existentes que utilizan varios algoritmos de agrupamiento para producir los resultados de agrupamiento base, el algoritmo propuesto extrae aleatoriamente un subconjunto de características de muestras y utiliza el algoritmo de agrupamiento tradicional para obtener resultados de agrupamiento base diversos. Basándose en los resultados de agrupamiento base, se utiliza el etiquetado para alinear todos los resultados de agrupamiento en un orden dado y se utiliza un método de votación para obtener la región central y la región de borde del agrupamiento de tres vías. El algoritmo propuesto se puede aplicar en la parte superior de cualquier algoritmo de agrupamiento duro existente para generar los resultados de agrupamiento base. Como ejemplos para demostración, aplicamos el algoritmo propuesto en la parte superior de K-means y el agrupamiento espectral, respectivamente. Los resultados experimentales muestran que el algoritmo propuesto es efectivo para revelar estructuras de grupos.