Atributo seleccionando en Naive Bayes aumentado por árbol mediante minimización de riesgos por validación cruzada
Autores: Chen, Shenglei; Zhang, Zhonghui; Liu, Linyuan
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Atributo seleccionando en Naive Bayes aumentado por árbol mediante minimización de riesgos por validación cruzada
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Mejora
Naive bayes
Aumentado por árbol
Rendimiento de clasificación
Eficiencia
Atributos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Como una mejora importante al Bayes ingenuo, el Bayes ingenuo aumentado por árbol (TAN) exhibe un excelente rendimiento de clasificación y eficiencia ya que permite que cada atributo dependa de a lo sumo otro atributo además de la variable de clase. Sin embargo, su rendimiento podría disminuir ya que algunos atributos podrían ser redundantes. En este documento, proponemos un algoritmo de Bayes ingenuo aumentado por árbol selectivo de atributos (STAN) que construye una secuencia de modelos aproximados, cada uno involucrando solo los primeros atributos específicos y busca minimizar el riesgo de validación cruzada en el modelo. Se han explorado cinco enfoques diferentes para clasificar los atributos. Dado que los modelos pueden evaluarse simultáneamente en un solo pase de aprendizaje a través de los datos, es eficiente y puede evitar los óptimos locales en el espacio del modelo. Los experimentos extensos en 70 conjuntos de datos de UCI demostraron que STAN logra un rendimiento superior manteniendo la eficiencia y la simplicidad.
Descripción
Como una mejora importante al Bayes ingenuo, el Bayes ingenuo aumentado por árbol (TAN) exhibe un excelente rendimiento de clasificación y eficiencia ya que permite que cada atributo dependa de a lo sumo otro atributo además de la variable de clase. Sin embargo, su rendimiento podría disminuir ya que algunos atributos podrían ser redundantes. En este documento, proponemos un algoritmo de Bayes ingenuo aumentado por árbol selectivo de atributos (STAN) que construye una secuencia de modelos aproximados, cada uno involucrando solo los primeros atributos específicos y busca minimizar el riesgo de validación cruzada en el modelo. Se han explorado cinco enfoques diferentes para clasificar los atributos. Dado que los modelos pueden evaluarse simultáneamente en un solo pase de aprendizaje a través de los datos, es eficiente y puede evitar los óptimos locales en el espacio del modelo. Los experimentos extensos en 70 conjuntos de datos de UCI demostraron que STAN logra un rendimiento superior manteniendo la eficiencia y la simplicidad.