Encontrar buenos subconjuntos de atributos para mejorar los árboles de decisión utilizando un envoltorio de algoritmo genético; una aplicación de aprendizaje supervisado en el sector de negocios de alimentos para la clasificación de tipos de vino
Autores: Gkikas, Dimitris C.; Theodoridis, Prokopis K.; Theodoridis, Theodoros; Gkikas, Marios C.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Encontrar buenos subconjuntos de atributos para mejorar los árboles de decisión utilizando un envoltorio de algoritmo genético; una aplicación de aprendizaje supervisado en el sector de negocios de alimentos para la clasificación de tipos de vino
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Estudio
Tomadores de decisiones
Grandes conjuntos de datos
árbol de decisión binario
Algoritmo genético
Sobreajuste
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio tiene como objetivo proporcionar un método que ayude a los tomadores de decisiones a gestionar grandes conjuntos de datos, eliminando el riesgo de decisión y destacando subconjuntos significativos de datos con cierto peso. Así, se combinan los métodos de árbol de decisión binario (BDT) y algoritmo genético (GA) utilizando una técnica de envoltura. El algoritmo BDT se utiliza para clasificar datos en una estructura de árbol, mientras que el GA se utiliza para identificar las mejores combinaciones de atributos de un conjunto de combinaciones posibles, denominadas generaciones. El estudio busca abordar el problema del sobreajuste que puede ocurrir al clasificar grandes conjuntos de datos al reducir el número de atributos utilizados en la clasificación. Utilizando el GA, se minimiza el número de atributos seleccionados, reduciendo el riesgo de sobreajuste. El algoritmo produce muchos conjuntos de atributos que son clasificados utilizando el algoritmo BDT y se les asigna un número de aptitud basado en su precisión. El conjunto de atributos más apto, o cromosomas, así como los BDT, son seleccionados para un análisis más profundo. El proceso de entrenamiento utiliza los datos de un análisis químico de vinos cultivados en la misma región pero derivados de tres cultivares diferentes. Los resultados demuestran la efectividad de este enfoque innovador en la definición de ciertos ingredientes y pesos del origen del vino.
Descripción
Este estudio tiene como objetivo proporcionar un método que ayude a los tomadores de decisiones a gestionar grandes conjuntos de datos, eliminando el riesgo de decisión y destacando subconjuntos significativos de datos con cierto peso. Así, se combinan los métodos de árbol de decisión binario (BDT) y algoritmo genético (GA) utilizando una técnica de envoltura. El algoritmo BDT se utiliza para clasificar datos en una estructura de árbol, mientras que el GA se utiliza para identificar las mejores combinaciones de atributos de un conjunto de combinaciones posibles, denominadas generaciones. El estudio busca abordar el problema del sobreajuste que puede ocurrir al clasificar grandes conjuntos de datos al reducir el número de atributos utilizados en la clasificación. Utilizando el GA, se minimiza el número de atributos seleccionados, reduciendo el riesgo de sobreajuste. El algoritmo produce muchos conjuntos de atributos que son clasificados utilizando el algoritmo BDT y se les asigna un número de aptitud basado en su precisión. El conjunto de atributos más apto, o cromosomas, así como los BDT, son seleccionados para un análisis más profundo. El proceso de entrenamiento utiliza los datos de un análisis químico de vinos cultivados en la misma región pero derivados de tres cultivares diferentes. Los resultados demuestran la efectividad de este enfoque innovador en la definición de ciertos ingredientes y pesos del origen del vino.