Un algoritmo de agrupamiento jerárquico mejorado basado en la idea de reproducción y fusión de poblaciones
Autores: Yin, Lifeng; Li, Menglin; Chen, Huayue; Deng, Wu
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un algoritmo de agrupamiento jerárquico mejorado basado en la idea de reproducción y fusión de poblaciones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Propone algoritmo de agrupamiento jerárquico PRI-MFC
Preagrupamiento difuso
Fusión de agrupamiento Jaccard
Efecto de agrupamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Con el objetivo de resolver los problemas del algoritmo tradicional de agrupamiento jerárquico que no puede encontrar grupos con densidad desigual, requiere una gran cantidad de cálculos y tiene baja eficiencia, este artículo propone un algoritmo de agrupamiento jerárquico mejorado (denominado PRI-MFC) basado en la idea de reproducción y fusión de poblaciones. Se divide en dos etapas: preagrupamiento difuso y agrupamiento de fusión de Jaccard. En la etapa de preagrupamiento difuso, se determina el punto central, se utiliza el producto del radio del vecindario y el grado de dispersión como referencia para dividir los datos, se utiliza la distancia euclidiana para determinar la similitud de los dos puntos de datos y se utiliza el grado de membresía para registrar la información de los puntos comunes en cada grupo. En la etapa de agrupamiento de fusión de Jaccard, los grupos con puntos comunes son los grupos que se fusionarán, y los grupos cuyo coeficiente de similitud de Jaccard entre los grupos a fusionar es mayor que el parámetro de fusión se fusionan. Los puntos comunes de los grupos cuyo coeficiente de similitud de Jaccard entre grupos es menor que el parámetro de fusión se dividen en el grupo con el mayor grado de membresía. Se diseñan una variedad de experimentos desde múltiples perspectivas en conjuntos de datos artificiales y reales para demostrar la superioridad del algoritmo PRI-MFC en cuanto al efecto de agrupamiento, calidad de agrupamiento y consumo de tiempo. Se realizan experimentos en datos de encuestas financieras de hogares chinos y se obtienen resultados de agrupamiento que se ajustan a la situación real de los hogares chinos, lo que muestra la practicidad de este algoritmo.
Descripción
Con el objetivo de resolver los problemas del algoritmo tradicional de agrupamiento jerárquico que no puede encontrar grupos con densidad desigual, requiere una gran cantidad de cálculos y tiene baja eficiencia, este artículo propone un algoritmo de agrupamiento jerárquico mejorado (denominado PRI-MFC) basado en la idea de reproducción y fusión de poblaciones. Se divide en dos etapas: preagrupamiento difuso y agrupamiento de fusión de Jaccard. En la etapa de preagrupamiento difuso, se determina el punto central, se utiliza el producto del radio del vecindario y el grado de dispersión como referencia para dividir los datos, se utiliza la distancia euclidiana para determinar la similitud de los dos puntos de datos y se utiliza el grado de membresía para registrar la información de los puntos comunes en cada grupo. En la etapa de agrupamiento de fusión de Jaccard, los grupos con puntos comunes son los grupos que se fusionarán, y los grupos cuyo coeficiente de similitud de Jaccard entre los grupos a fusionar es mayor que el parámetro de fusión se fusionan. Los puntos comunes de los grupos cuyo coeficiente de similitud de Jaccard entre grupos es menor que el parámetro de fusión se dividen en el grupo con el mayor grado de membresía. Se diseñan una variedad de experimentos desde múltiples perspectivas en conjuntos de datos artificiales y reales para demostrar la superioridad del algoritmo PRI-MFC en cuanto al efecto de agrupamiento, calidad de agrupamiento y consumo de tiempo. Se realizan experimentos en datos de encuestas financieras de hogares chinos y se obtienen resultados de agrupamiento que se ajustan a la situación real de los hogares chinos, lo que muestra la practicidad de este algoritmo.