Eficiente clasificación multiclase utilizando selección de características en conjuntos de datos de alta dimensionalidad
Autores: Kumar, Ankur; Kaur, Avinash; Singh, Parminder; Driss, Maha; Boulila, Wadii
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Eficiente clasificación multiclase utilizando selección de características en conjuntos de datos de alta dimensionalidad
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Selección de características
Problemas de clasificación
Conjunto de datos
Rendimiento
Precisión
Algoritmo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
La selección de características se ha vuelto esencial en problemas de clasificación con numerosas características. Este proceso implica eliminar características redundantes, ruidosas y que impactan negativamente en el conjunto de datos para mejorar el rendimiento del clasificador. Algunas características son menos útiles que otras o no se correlacionan con la evaluación del sistema, y su eliminación no afecta el rendimiento del sistema. En la mayoría de los casos, eliminar características con un impacto monótonamente decreciente en el rendimiento del sistema aumenta la precisión. Por lo tanto, esta investigación tiene como objetivo proponer un método de reducción de dimensionalidad utilizando una técnica de selección de características para mejorar la precisión. Este documento propone un enfoque de selección de características novedoso que combina técnicas de filtro y envoltura para seleccionar características óptimas utilizando Información Mutua con el Método Secuencial Forward y validación cruzada de 10 pliegues. Los resultados muestran que el algoritmo propuesto puede reducir características en más del 75% en conjuntos de datos con muchas características y lograr una precisión máxima del 97%. El algoritmo supera o tiene un rendimiento similar a los existentes. El algoritmo propuesto podría ser una mejor opción para problemas de clasificación con características minimizadas.
Descripción
La selección de características se ha vuelto esencial en problemas de clasificación con numerosas características. Este proceso implica eliminar características redundantes, ruidosas y que impactan negativamente en el conjunto de datos para mejorar el rendimiento del clasificador. Algunas características son menos útiles que otras o no se correlacionan con la evaluación del sistema, y su eliminación no afecta el rendimiento del sistema. En la mayoría de los casos, eliminar características con un impacto monótonamente decreciente en el rendimiento del sistema aumenta la precisión. Por lo tanto, esta investigación tiene como objetivo proponer un método de reducción de dimensionalidad utilizando una técnica de selección de características para mejorar la precisión. Este documento propone un enfoque de selección de características novedoso que combina técnicas de filtro y envoltura para seleccionar características óptimas utilizando Información Mutua con el Método Secuencial Forward y validación cruzada de 10 pliegues. Los resultados muestran que el algoritmo propuesto puede reducir características en más del 75% en conjuntos de datos con muchas características y lograr una precisión máxima del 97%. El algoritmo supera o tiene un rendimiento similar a los existentes. El algoritmo propuesto podría ser una mejor opción para problemas de clasificación con características minimizadas.