Clasificación de Conjuntos Eficiente para Flujos de Datos Multi-Etiqueta con Deriva de Concepto
Autores: Sun, Yange; Shao, Han; Wang, Shasha
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Clasificación de Conjuntos Eficiente para Flujos de Datos Multi-Etiqueta con Deriva de Concepto
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Existente
Múltiples etiquetas
Flujos de datos
Métodos de clasificación
Dependencia de etiquetas
Cambio de concepto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La mayoría de los métodos existentes para la clasificación de flujos de datos multi-etiqueta se centran en extender los enfoques de clasificación de flujos de datos de etiqueta única a casos de múltiples etiquetas, sin considerar las características especiales de los datos de flujo multi-etiqueta, como la dependencia de etiquetas, el cambio de concepto y los conceptos recurrentes. Motivados por estos desafíos, diseñamos un paradigma de conjunto eficiente para la clasificación de flujos de datos multi-etiqueta. El algoritmo implementa una nueva detección de cambios basada en la divergencia de Jensen-Shannon para identificar diferentes tipos de cambio de concepto en los flujos de datos. Además, nuestro método intenta considerar la dependencia de etiquetas al eliminar combinaciones de etiquetas poco frecuentes para mejorar el rendimiento de la clasificación. Los resultados empíricos en conjuntos de datos sintéticos y del mundo real han demostrado su efectividad.
Descripción
La mayoría de los métodos existentes para la clasificación de flujos de datos multi-etiqueta se centran en extender los enfoques de clasificación de flujos de datos de etiqueta única a casos de múltiples etiquetas, sin considerar las características especiales de los datos de flujo multi-etiqueta, como la dependencia de etiquetas, el cambio de concepto y los conceptos recurrentes. Motivados por estos desafíos, diseñamos un paradigma de conjunto eficiente para la clasificación de flujos de datos multi-etiqueta. El algoritmo implementa una nueva detección de cambios basada en la divergencia de Jensen-Shannon para identificar diferentes tipos de cambio de concepto en los flujos de datos. Además, nuestro método intenta considerar la dependencia de etiquetas al eliminar combinaciones de etiquetas poco frecuentes para mejorar el rendimiento de la clasificación. Los resultados empíricos en conjuntos de datos sintéticos y del mundo real han demostrado su efectividad.