Los grupos dentro del agrupamiento de Condorcet
Autores: Faouzi, Tarik; Firinguetti-Limone, Luis; Avilez-Bozo, José Miguel; Carvajal-Schiaffino, Rubén
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Los grupos dentro del agrupamiento de Condorcet
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Nuevo enfoque
Agrupamiento
Datos categóricos
Condorcet
Número fijo de grupos
Medidas de similitud y disimilitud
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Introducimos un nuevo enfoque para la agrupación de datos categóricos: el clustering de Condorcet con un número fijo de grupos, denominado -Condorcet. Como los -modos, este enfoque se basa esencialmente en medidas de similitud y disimilitud. El artículo se divide en tres partes: primero, proponemos un nuevo criterio de Condorcet, con un número fijo de grupos (para seleccionar casos en clusters). En la segunda parte, proponemos un algoritmo heurístico para llevar a cabo la tarea. En la tercera parte, comparamos el clustering de -Condorcet con el clustering de -modos. La comparación se realiza con un índice de calidad, precisión de una medida y un índice de suma de cuadrados dentro de los clusters. Nuestros hallazgos se ilustran utilizando conjuntos de datos reales: el conjunto de datos felino y el conjunto de datos del censo de EE. UU. de 1990.
Descripción
Introducimos un nuevo enfoque para la agrupación de datos categóricos: el clustering de Condorcet con un número fijo de grupos, denominado -Condorcet. Como los -modos, este enfoque se basa esencialmente en medidas de similitud y disimilitud. El artículo se divide en tres partes: primero, proponemos un nuevo criterio de Condorcet, con un número fijo de grupos (para seleccionar casos en clusters). En la segunda parte, proponemos un algoritmo heurístico para llevar a cabo la tarea. En la tercera parte, comparamos el clustering de -Condorcet con el clustering de -modos. La comparación se realiza con un índice de calidad, precisión de una medida y un índice de suma de cuadrados dentro de los clusters. Nuestros hallazgos se ilustran utilizando conjuntos de datos reales: el conjunto de datos felino y el conjunto de datos del censo de EE. UU. de 1990.