Algoritmos de reducción de atributos no supervisados para datos de valores múltiples basados en medición de incertidumbre
Autores: Guo, Xiaoyan; Peng, Yichun; Li, Yu; Lin, Hai
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Algoritmos de reducción de atributos no supervisados para datos de valores múltiples basados en medición de incertidumbre
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Minería de datos
Algoritmos de reducción de atributos no supervisados
Datos de valores múltiples
Sistema de información
Entropía de la información
Detección de valores atípicos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La falta de datos introduce incertidumbre en la minería de datos, pero los enfoques existentes basados en conjuntos ignoran la información de frecuencia. Proponemos algoritmos de reducción de atributos no supervisados para datos de valores de multiconjuntos para abordar esta brecha. Primero, definimos un sistema de información de valores de multiconjuntos (MSVIS) y establecemos una relación de -tolerancia para formar los gránulos de información. Luego, se introducen la entropía de información de -información y la cantidad de información de -información como medidas de incertidumbre. Finalmente, estos dos UMs se utilizan para diseñar dos algoritmos de reducción de atributos no supervisados en un MSVIS. Los resultados experimentales demuestran la superioridad de los algoritmos propuestos, logrando reducciones promedio del 50% en subconjuntos de atributos mientras se mejora la precisión de agrupamiento y el rendimiento de detección de valores atípicos. El análisis de parámetros valida aún más la robustez del marco bajo tasas variables de datos faltantes.
Descripción
La falta de datos introduce incertidumbre en la minería de datos, pero los enfoques existentes basados en conjuntos ignoran la información de frecuencia. Proponemos algoritmos de reducción de atributos no supervisados para datos de valores de multiconjuntos para abordar esta brecha. Primero, definimos un sistema de información de valores de multiconjuntos (MSVIS) y establecemos una relación de -tolerancia para formar los gránulos de información. Luego, se introducen la entropía de información de -información y la cantidad de información de -información como medidas de incertidumbre. Finalmente, estos dos UMs se utilizan para diseñar dos algoritmos de reducción de atributos no supervisados en un MSVIS. Los resultados experimentales demuestran la superioridad de los algoritmos propuestos, logrando reducciones promedio del 50% en subconjuntos de atributos mientras se mejora la precisión de agrupamiento y el rendimiento de detección de valores atípicos. El análisis de parámetros valida aún más la robustez del marco bajo tasas variables de datos faltantes.