Un método rápido para estimar el número de clústeres basado en la puntuación y la distancia mínima del punto central
Autores: He, Zhenzhen; Jia, Zongpu; Zhang, Xiaohong
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Un método rápido para estimar el número de clústeres basado en la puntuación y la distancia mínima del punto central
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Agrupamiento
Número de clústeres
Estimación de densidad de núcleo gaussiano
Puntuación del punto central
Conjunto de candidatos
Distancia mínima
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El agrupamiento se utiliza ampliamente como un algoritmo de aprendizaje no supervisado. Sin embargo, a menudo es necesario ingresar manualmente el número de clústeres, y el número de clústeres tiene un gran impacto en el efecto del agrupamiento. En la actualidad, los investigadores proponen algunos algoritmos para determinar el número de clústeres, pero los resultados no son muy buenos para determinar el número de clústeres de conjuntos de datos con formas complejas y dispersas. Para resolver estos problemas, este artículo propone utilizar la función de estimación de densidad del núcleo gaussiano para determinar el número máximo de clústeres, usar el cambio en la puntuación del punto central para obtener el conjunto candidato de puntos centrales y, además, utilizar el cambio de la distancia mínima entre puntos centrales para obtener el número de clústeres. El experimento muestra la validez y la practicidad del algoritmo propuesto.
Descripción
El agrupamiento se utiliza ampliamente como un algoritmo de aprendizaje no supervisado. Sin embargo, a menudo es necesario ingresar manualmente el número de clústeres, y el número de clústeres tiene un gran impacto en el efecto del agrupamiento. En la actualidad, los investigadores proponen algunos algoritmos para determinar el número de clústeres, pero los resultados no son muy buenos para determinar el número de clústeres de conjuntos de datos con formas complejas y dispersas. Para resolver estos problemas, este artículo propone utilizar la función de estimación de densidad del núcleo gaussiano para determinar el número máximo de clústeres, usar el cambio en la puntuación del punto central para obtener el conjunto candidato de puntos centrales y, además, utilizar el cambio de la distancia mínima entre puntos centrales para obtener el número de clústeres. El experimento muestra la validez y la practicidad del algoritmo propuesto.