Simple algoritmo de particionamiento K-Medoids para datos de variables mixtas
Autores: Budiaji, Weksi; Leisch, Friedrich
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Simple algoritmo de particionamiento K-Medoids para datos de variables mixtas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Algoritmo
Medoides
Distancia
Clústeres
Variación
Conjunto de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 67
Citaciones: Sin citaciones
Se ha desarrollado un algoritmo k-medoids simple y rápido que actualiza los medoids minimizando la distancia total dentro de los clústeres. Aunque es simple y rápido, como su nombre sugiere, no obstante ha descuidado los óptimos locales y los clústeres vacíos que pueden surgir. Con la distancia como entrada al algoritmo, se desarrolla una función de distancia generalizada para aumentar la variación de las distancias, especialmente para un conjunto de datos de variables mixtas. La variación de las distancias es una parte crucial de un algoritmo de particionamiento debido a que diferentes distancias producen resultados distintos. Los resultados experimentales del simple algoritmo k-medoids producen consistentemente buenos rendimientos en varios ajustes de datos de variables mixtas. También tiene una alta precisión de clúster en comparación con otros algoritmos de particionamiento basados en distancias para datos de variables mixtas.
Descripción
Se ha desarrollado un algoritmo k-medoids simple y rápido que actualiza los medoids minimizando la distancia total dentro de los clústeres. Aunque es simple y rápido, como su nombre sugiere, no obstante ha descuidado los óptimos locales y los clústeres vacíos que pueden surgir. Con la distancia como entrada al algoritmo, se desarrolla una función de distancia generalizada para aumentar la variación de las distancias, especialmente para un conjunto de datos de variables mixtas. La variación de las distancias es una parte crucial de un algoritmo de particionamiento debido a que diferentes distancias producen resultados distintos. Los resultados experimentales del simple algoritmo k-medoids producen consistentemente buenos rendimientos en varios ajustes de datos de variables mixtas. También tiene una alta precisión de clúster en comparación con otros algoritmos de particionamiento basados en distancias para datos de variables mixtas.