Acmkc: un modelo compacto de clasificación asociativa que utiliza el agrupamiento de k-modes con representaciones de reglas por cobertura
Autores: Mattiev, Jamolbek; Davityan, Monte; Kavsek, Branko
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Acmkc: un modelo compacto de clasificación asociativa que utiliza el agrupamiento de k-modes con representaciones de reglas por cobertura
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos
Explosión de reglas
Minería de reglas de asociación
Grupos
Algoritmo FP-Growth
Interpretabilidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La generación y análisis de grandes cantidades de datos se han vuelto cada vez más comunes en diversas aplicaciones. En este estudio, proponemos un enfoque novedoso para abordar el desafío de la explosión de reglas en la minería de reglas de asociación mediante la utilización de representaciones basadas en la cobertura de los clústeres determinados por K-modes. Utilizamos el algoritmo FP-Growth para generar reglas de asociación de clase (CARs). Para mejorar aún más la interpretabilidad y la compacidad del conjunto de reglas, empleamos el algoritmo de agrupamiento K-modes con una métrica de distancia que binariza las reglas. El número óptimo de clústeres se determina utilizando la puntuación de silueta. Luego se seleccionan reglas representativas en función de su cobertura dentro de cada clúster. Para evaluar la efectividad de nuestro enfoque, realizamos evaluaciones experimentales en conjuntos de datos de UCI y Kaggle. Los resultados muestran una reducción significativa en el espacio de reglas (71 reglas en promedio, que es el mejor resultado entre todos los algoritmos de aprendizaje de reglas de última generación), alineándose con nuestro objetivo de producir clasificadores compactos. Nuestro enfoque ofrece una solución prometedora para manejar la complejidad de las reglas en la minería de reglas de asociación, facilitando así una mejor interpretación y análisis de reglas, manteniendo una precisión de clasificación significativamente similar (ACMKC: 80.0% en promedio) a otros aprendices de reglas en la mayoría de los conjuntos de datos.
Descripción
La generación y análisis de grandes cantidades de datos se han vuelto cada vez más comunes en diversas aplicaciones. En este estudio, proponemos un enfoque novedoso para abordar el desafío de la explosión de reglas en la minería de reglas de asociación mediante la utilización de representaciones basadas en la cobertura de los clústeres determinados por K-modes. Utilizamos el algoritmo FP-Growth para generar reglas de asociación de clase (CARs). Para mejorar aún más la interpretabilidad y la compacidad del conjunto de reglas, empleamos el algoritmo de agrupamiento K-modes con una métrica de distancia que binariza las reglas. El número óptimo de clústeres se determina utilizando la puntuación de silueta. Luego se seleccionan reglas representativas en función de su cobertura dentro de cada clúster. Para evaluar la efectividad de nuestro enfoque, realizamos evaluaciones experimentales en conjuntos de datos de UCI y Kaggle. Los resultados muestran una reducción significativa en el espacio de reglas (71 reglas en promedio, que es el mejor resultado entre todos los algoritmos de aprendizaje de reglas de última generación), alineándose con nuestro objetivo de producir clasificadores compactos. Nuestro enfoque ofrece una solución prometedora para manejar la complejidad de las reglas en la minería de reglas de asociación, facilitando así una mejor interpretación y análisis de reglas, manteniendo una precisión de clasificación significativamente similar (ACMKC: 80.0% en promedio) a otros aprendices de reglas en la mayoría de los conjuntos de datos.