Conjunto de clasificadores basados en filtros para guiar un optimizador de enjambre epsilon-greedy para la selección de subconjuntos de características de alta dimensión
Autores: Dowlatshahi, Mohammad Bagher; Derhami, Vali; Nezamabadi-pour, Hossein
Idioma: Inglés
Editor: MDPI
Año: 2017
Acceso abierto
Artículo científico
2017
Conjunto de clasificadores basados en filtros para guiar un optimizador de enjambre epsilon-greedy para la selección de subconjuntos de características de alta dimensión
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Selección de subconjuntos de características
Algoritmos
Conjuntos de datos de alta dimensión
Conocimiento del dominio
Problema de optimización binaria
Conjunto de clasificadores basados en filtros
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El propósito principal de la selección de subconjuntos de características es eliminar características irrelevantes y redundantes de los datos, para que los algoritmos de aprendizaje puedan ser entrenados con un subconjunto de características relevantes. Hasta ahora, se han desarrollado muchos algoritmos para la selección de subconjuntos de características, y la mayoría de estos algoritmos sufren de dos problemas principales al resolver conjuntos de datos de alta dimensión: Primero, algunos de estos algoritmos buscan en un espacio de características de alta dimensión sin ningún conocimiento del dominio sobre la importancia de las características. Segundo, la mayoría de estos algoritmos están diseñados originalmente para problemas de optimización continua, pero la selección de características es un problema de optimización binaria. Para superar las debilidades mencionadas, proponemos un nuevo algoritmo híbrido de filtro-envuelto, llamado Conjunto de Clasificadores Basados en Filtros para guiar un Optimizador de Enjambre Epsilon-greedy (EFR-ESO), para resolver la selección de subconjuntos de características de alta dimensión. El Optimizador de Enjambre Epsilon-greedy (ESO) es un nuevo algoritmo de inteligencia de enjambre binario introducido en este documento como un nuevo envoltorio. En el EFR-ESO propuesto, extraemos el conocimiento sobre la importancia de las características mediante el conjunto de clasificadores basados en filtros y luego usamos este conocimiento para ponderar las probabilidades de las características en el ESO. Los experimentos en 14 conjuntos de datos de alta dimensión indican que el algoritmo propuesto tiene un rendimiento excelente tanto en términos de la tasa de error de la clasificación como en la minimización del número de características.
Descripción
El propósito principal de la selección de subconjuntos de características es eliminar características irrelevantes y redundantes de los datos, para que los algoritmos de aprendizaje puedan ser entrenados con un subconjunto de características relevantes. Hasta ahora, se han desarrollado muchos algoritmos para la selección de subconjuntos de características, y la mayoría de estos algoritmos sufren de dos problemas principales al resolver conjuntos de datos de alta dimensión: Primero, algunos de estos algoritmos buscan en un espacio de características de alta dimensión sin ningún conocimiento del dominio sobre la importancia de las características. Segundo, la mayoría de estos algoritmos están diseñados originalmente para problemas de optimización continua, pero la selección de características es un problema de optimización binaria. Para superar las debilidades mencionadas, proponemos un nuevo algoritmo híbrido de filtro-envuelto, llamado Conjunto de Clasificadores Basados en Filtros para guiar un Optimizador de Enjambre Epsilon-greedy (EFR-ESO), para resolver la selección de subconjuntos de características de alta dimensión. El Optimizador de Enjambre Epsilon-greedy (ESO) es un nuevo algoritmo de inteligencia de enjambre binario introducido en este documento como un nuevo envoltorio. En el EFR-ESO propuesto, extraemos el conocimiento sobre la importancia de las características mediante el conjunto de clasificadores basados en filtros y luego usamos este conocimiento para ponderar las probabilidades de las características en el ESO. Los experimentos en 14 conjuntos de datos de alta dimensión indican que el algoritmo propuesto tiene un rendimiento excelente tanto en términos de la tasa de error de la clasificación como en la minimización del número de características.