Algoritmo de agrupamiento híbrido de Fuzzy C-Means orientado a dominios de Big Data
Autores: Pérez-Ortega, Joaquín; Roblero-Aguilar, Sandra Silvia; Almanza-Ortega, Nelva Nely; Frausto Solís, Juan; Zavala-Díaz, Crispín; Hernández, Yasmín; Landero-Nájera, Vanesa
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Algoritmo de agrupamiento híbrido de Fuzzy C-Means orientado a dominios de Big Data
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Híbrido
Fuzzy c-means
K-means
Algoritmo
Conjunto de datos
Matriz de pertenencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Se propone una variante híbrida de los algoritmos Fuzzy C-Means y K-Means para resolver grandes conjuntos de datos como los presentados en Big Data. El algoritmo Fuzzy C-Means es sensible a los valores iniciales de la matriz de membresía. Por lo tanto, una configuración especial de la matriz puede acelerar la convergencia del algoritmo. En este sentido, se propone un nuevo enfoque, que llamamos Hybrid OK-Means Fuzzy C-Means (HOFCM), y optimiza los valores del parámetro de la matriz de membresía. Este enfoque consta de tres pasos: (a) generar un conjunto de soluciones de un conjunto de datos, aplicando una variante del algoritmo K-Means; (b) seleccionar la mejor solución como base para generar la matriz de membresía optimizada; (c) resolver el conjunto de datos con Fuzzy C-Means. Los resultados experimentales con cuatro conjuntos de datos reales y un conjunto de datos sintético muestran que HOFCM reduce el tiempo hasta en un 93.94% en comparación con el tiempo promedio del estándar Fuzzy C-Means. Se destaca que la calidad de la solución se redujo en un 2.51% en el peor de los casos.
Descripción
Se propone una variante híbrida de los algoritmos Fuzzy C-Means y K-Means para resolver grandes conjuntos de datos como los presentados en Big Data. El algoritmo Fuzzy C-Means es sensible a los valores iniciales de la matriz de membresía. Por lo tanto, una configuración especial de la matriz puede acelerar la convergencia del algoritmo. En este sentido, se propone un nuevo enfoque, que llamamos Hybrid OK-Means Fuzzy C-Means (HOFCM), y optimiza los valores del parámetro de la matriz de membresía. Este enfoque consta de tres pasos: (a) generar un conjunto de soluciones de un conjunto de datos, aplicando una variante del algoritmo K-Means; (b) seleccionar la mejor solución como base para generar la matriz de membresía optimizada; (c) resolver el conjunto de datos con Fuzzy C-Means. Los resultados experimentales con cuatro conjuntos de datos reales y un conjunto de datos sintético muestran que HOFCM reduce el tiempo hasta en un 93.94% en comparación con el tiempo promedio del estándar Fuzzy C-Means. Se destaca que la calidad de la solución se redujo en un 2.51% en el peor de los casos.