Determinando a priori el rendimiento del clasificador asociativo ingenuo personalizado para la clasificación de datos empresariales basado en medidas de complejidad de datos
Autores: Tusell-Rey, Claudia C.; Camacho-Nieto, Oscar; Yáñez-Márquez, Cornelio; Villuendas-Rey, Yenny; Tejeida-Padilla, Ricardo; Benguría, Carmen F. Rey
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Determinando a priori el rendimiento del clasificador asociativo ingenuo personalizado para la clasificación de datos empresariales basado en medidas de complejidad de datos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Clasificación supervisada
Problema de selección de algoritmo
Complejidad de datos
Clasificador Asociativo Naïve Personalizado
área de negocios
Meta-aprendizaje
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
En el área de clasificación supervisada, el problema de selección de algoritmo (ASP) se refiere a determinar el rendimiento a priori de un clasificador dado en algún problema específico, así como a encontrar cuál es el clasificador más adecuado para algunas tareas. Recientemente, este tema ha atraído la atención de grupos de investigación internacionales porque ha surgido una veta de investigación muy prometedora: la aplicación de algunas medidas de complejidad de datos en los algoritmos de clasificación de patrones. Este documento tiene como objetivo analizar la respuesta del Clasificador Asociativo Naïve Personalizado (CNAC) en datos tomados del área empresarial cuando se introducen algunas medidas de complejidad de datos. Para realizar este análisis, utilizamos conjuntos de datos de clasificación del mundo real relacionados con los negocios, 22 en total; luego, calculamos el valor de nueve medidas de complejidad de datos para comparar el rendimiento del CNAC con otros algoritmos del estado del arte. Un aspecto muy importante de realizar esta tarea es la creación de un conjunto de datos artificial con fines de metaaprendizaje, en el que consideramos el rendimiento de CNAC, y luego entrenamos un árbol de decisión como metaaprendiz. Como se muestra, el clasificador CNAC obtuvo los mejores resultados para 10 de los 22 conjuntos de datos del estudio experimental.
Descripción
En el área de clasificación supervisada, el problema de selección de algoritmo (ASP) se refiere a determinar el rendimiento a priori de un clasificador dado en algún problema específico, así como a encontrar cuál es el clasificador más adecuado para algunas tareas. Recientemente, este tema ha atraído la atención de grupos de investigación internacionales porque ha surgido una veta de investigación muy prometedora: la aplicación de algunas medidas de complejidad de datos en los algoritmos de clasificación de patrones. Este documento tiene como objetivo analizar la respuesta del Clasificador Asociativo Naïve Personalizado (CNAC) en datos tomados del área empresarial cuando se introducen algunas medidas de complejidad de datos. Para realizar este análisis, utilizamos conjuntos de datos de clasificación del mundo real relacionados con los negocios, 22 en total; luego, calculamos el valor de nueve medidas de complejidad de datos para comparar el rendimiento del CNAC con otros algoritmos del estado del arte. Un aspecto muy importante de realizar esta tarea es la creación de un conjunto de datos artificial con fines de metaaprendizaje, en el que consideramos el rendimiento de CNAC, y luego entrenamos un árbol de decisión como metaaprendiz. Como se muestra, el clasificador CNAC obtuvo los mejores resultados para 10 de los 22 conjuntos de datos del estudio experimental.