Optimizando la reducción de atributos en datos de múltiples granularidades a través de un modelo híbrido supervisado-no supervisado
Autores: Fan, Zeyuan; Chen, Jianjun; Cui, Hongyang; Song, Jingjing; Xu, Taihua
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Optimizando la reducción de atributos en datos de múltiples granularidades a través de un modelo híbrido supervisado-no supervisado
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Reducción de atributos
Modelo de multi-granularidad
Proporción de ganancia de información de vecindario
Perspectivas supervisadas y no supervisadas
Tecnología de multi-granularidad
Teoría de conjuntos aproximados de vecindario
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
La reducción de atributos es una técnica central en el dominio del conjunto aproximado y un paso importante en el preprocesamiento de datos. Los investigadores han propuesto numerosos métodos innovadores para mejorar la capacidad de reducción de atributos, como la aparición de modelos de conjunto aproximado de múltiples granularidades, que pueden procesar eficazmente datos distribuidos y de múltiples granularidades. Sin embargo, estos métodos innovadores aún tienen numerosas deficiencias, como abordar restricciones complejas y realizar evaluaciones de efectividad desde múltiples ángulos. Basado en el modelo de múltiples granularidades, este estudio propone un nuevo método de reducción de atributos, utilizando la relación de ganancia de información de vecindario de múltiples granularidades como criterio de medición. Este método combina perspectivas supervisadas y no supervisadas, e integrando la tecnología de múltiples granularidades con la teoría de conjunto aproximado de vecindario, construye un modelo que puede adaptarse a características de datos de múltiples niveles. Este método novedoso se destaca al abordar restricciones complejas y facilitar evaluaciones de efectividad desde múltiples perspectivas. Tiene varias ventajas: (1) combina métodos de aprendizaje supervisado y no supervisado, permitiendo una interpretación detallada de datos y una selección de atributos mejorada; (2) al incorporar estructuras de múltiples granularidades, el algoritmo puede analizar datos en varios niveles de granularidad. Esto permite una comprensión más detallada de las características de los datos en cada nivel, lo cual puede ser crucial para conjuntos de datos complejos; y (3) al utilizar relaciones de vecindario en lugar de relaciones de indiscernibilidad, el método maneja eficazmente datos inciertos y difusos, siendo adecuado para conjuntos de datos del mundo real que a menudo contienen información imprecisa o incompleta. No solo selecciona el nivel de granularidad o conjunto de atributos óptimo según requisitos específicos, sino que también demuestra su versatilidad y robustez a través de experimentos extensos en 15 conjuntos de datos de UCI. Los análisis comparativos contra seis algoritmos establecidos de reducción de atributos confirman la superior confiabilidad y consistencia de nuestro método propuesto. Esta investigación no solo mejora la comprensión de los mecanismos de reducción de atributos, sino que también establece un nuevo punto de referencia para futuras exploraciones en el campo.
Descripción
La reducción de atributos es una técnica central en el dominio del conjunto aproximado y un paso importante en el preprocesamiento de datos. Los investigadores han propuesto numerosos métodos innovadores para mejorar la capacidad de reducción de atributos, como la aparición de modelos de conjunto aproximado de múltiples granularidades, que pueden procesar eficazmente datos distribuidos y de múltiples granularidades. Sin embargo, estos métodos innovadores aún tienen numerosas deficiencias, como abordar restricciones complejas y realizar evaluaciones de efectividad desde múltiples ángulos. Basado en el modelo de múltiples granularidades, este estudio propone un nuevo método de reducción de atributos, utilizando la relación de ganancia de información de vecindario de múltiples granularidades como criterio de medición. Este método combina perspectivas supervisadas y no supervisadas, e integrando la tecnología de múltiples granularidades con la teoría de conjunto aproximado de vecindario, construye un modelo que puede adaptarse a características de datos de múltiples niveles. Este método novedoso se destaca al abordar restricciones complejas y facilitar evaluaciones de efectividad desde múltiples perspectivas. Tiene varias ventajas: (1) combina métodos de aprendizaje supervisado y no supervisado, permitiendo una interpretación detallada de datos y una selección de atributos mejorada; (2) al incorporar estructuras de múltiples granularidades, el algoritmo puede analizar datos en varios niveles de granularidad. Esto permite una comprensión más detallada de las características de los datos en cada nivel, lo cual puede ser crucial para conjuntos de datos complejos; y (3) al utilizar relaciones de vecindario en lugar de relaciones de indiscernibilidad, el método maneja eficazmente datos inciertos y difusos, siendo adecuado para conjuntos de datos del mundo real que a menudo contienen información imprecisa o incompleta. No solo selecciona el nivel de granularidad o conjunto de atributos óptimo según requisitos específicos, sino que también demuestra su versatilidad y robustez a través de experimentos extensos en 15 conjuntos de datos de UCI. Los análisis comparativos contra seis algoritmos establecidos de reducción de atributos confirman la superior confiabilidad y consistencia de nuestro método propuesto. Esta investigación no solo mejora la comprensión de los mecanismos de reducción de atributos, sino que también establece un nuevo punto de referencia para futuras exploraciones en el campo.