Reducción de Atributos de Vecindario: Una Estrategia Multicriterio Basada en la Selección de Muestras
Autores: Gao, Yuan; Chen, Xiangjian; Yang, Xibei; Wang, Pingxin
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Reducción de Atributos de Vecindario: Una Estrategia Multicriterio Basada en la Selección de Muestras
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reducción de atributos
Múltiples criterios
Algoritmo heurístico
Selección de muestras
Centroides de clúster
Tamaño de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En el campo de los conjuntos aproximados, el objetivo de la reducción de atributos es regular las variaciones de las medidas reduciendo los atributos de datos redundantes. Sin embargo, la mayoría de los conceptos anteriores de reducción de atributos fueron diseñados por una y solo una medida, lo que indica que el reducto obtenido puede no cumplir con las restricciones impuestas por otras medidas. Además, el algoritmo heurístico ampliamente utilizado para calcular un reducto requiere escanear todas las muestras en los datos, y el consumo de tiempo puede ser demasiado alto para ser aceptado si el tamaño de los datos es demasiado grande. Para aliviar estos problemas, se propone en este artículo un marco de reducción de atributos basado en múltiples criterios con selección de muestras. En primer lugar, se derivan los centroides de los clústeres a partir de los datos, y luego se pueden seleccionar muestras que están lejos de los centroides de los clústeres. Este paso completa el proceso de selección de muestras para reducir el tamaño de los datos. En segundo lugar, se diseñó una reducción de atributos basada en múltiples criterios, y se utilizó el algoritmo heurístico sobre las muestras seleccionadas para calcular el reducto en términos de múltiples criterios. Finalmente, los resultados experimentales sobre 12 conjuntos de datos de UCI muestran que los reductos obtenidos por nuestro marco no solo satisfacen las restricciones impuestas por múltiples criterios, sino que también proporcionan un mejor rendimiento de clasificación y un menor consumo de tiempo.
Descripción
En el campo de los conjuntos aproximados, el objetivo de la reducción de atributos es regular las variaciones de las medidas reduciendo los atributos de datos redundantes. Sin embargo, la mayoría de los conceptos anteriores de reducción de atributos fueron diseñados por una y solo una medida, lo que indica que el reducto obtenido puede no cumplir con las restricciones impuestas por otras medidas. Además, el algoritmo heurístico ampliamente utilizado para calcular un reducto requiere escanear todas las muestras en los datos, y el consumo de tiempo puede ser demasiado alto para ser aceptado si el tamaño de los datos es demasiado grande. Para aliviar estos problemas, se propone en este artículo un marco de reducción de atributos basado en múltiples criterios con selección de muestras. En primer lugar, se derivan los centroides de los clústeres a partir de los datos, y luego se pueden seleccionar muestras que están lejos de los centroides de los clústeres. Este paso completa el proceso de selección de muestras para reducir el tamaño de los datos. En segundo lugar, se diseñó una reducción de atributos basada en múltiples criterios, y se utilizó el algoritmo heurístico sobre las muestras seleccionadas para calcular el reducto en términos de múltiples criterios. Finalmente, los resultados experimentales sobre 12 conjuntos de datos de UCI muestran que los reductos obtenidos por nuestro marco no solo satisfacen las restricciones impuestas por múltiples criterios, sino que también proporcionan un mejor rendimiento de clasificación y un menor consumo de tiempo.