Algoritmo Mejorado de Selección de Características de Peso de Alivio Basado en Alivio e Información Mutua
Autores: Wang, Hongbin; Wang, Pengming; Deng, Shengchun; Li, Haoran
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Algoritmo Mejorado de Selección de Características de Peso de Alivio Basado en Alivio e Información Mutua
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Algoritmo clásico de selección de características
Algoritmo Relief
Problemas de clasificación binaria
Subconjuntos de características
Información mutua
Velocidad de cálculo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Como el algoritmo clásico de selección de características, el algoritmo Relief tiene las ventajas de un cálculo simple y alta eficiencia, pero el algoritmo en sí está limitado a tratar solo con problemas de clasificación binaria, y la capacidad de distinción integral de los subconjuntos de características compuestos por las K características anteriores seleccionadas por el algoritmo Relief a menudo es redundante, ya que el algoritmo no puede seleccionar el subconjunto de características ideal. Al calcular la correlación y la redundancia entre características mediante la información mutua, la velocidad de cálculo es lenta debido a la alta complejidad computacional y a la necesidad del método de calcular la función de densidad de probabilidad de las características correspondientes. Con el objetivo de resolver los problemas anteriores, primero mejoramos el peso del algoritmo Relief, de modo que pueda utilizarse para evaluar un conjunto de conjuntos de características candidatas. Luego, utilizamos la función de evaluación de información mutua conjunta mejorada para reemplazar el cálculo básico de información mutua y resolver el problema de la velocidad de cálculo, así como la correlación y la redundancia entre características. Finalmente, se propone un algoritmo de selección de características de correlación compuesta basado en Relief y en la información mutua conjunta utilizando la función de evaluación y la estrategia heurística de búsqueda secuencial hacia adelante. Este algoritmo puede seleccionar de manera efectiva subconjuntos de características con poca redundancia y fuertes características de clasificación, y tiene las excelentes características de una velocidad de cálculo más rápida.
Descripción
Como el algoritmo clásico de selección de características, el algoritmo Relief tiene las ventajas de un cálculo simple y alta eficiencia, pero el algoritmo en sí está limitado a tratar solo con problemas de clasificación binaria, y la capacidad de distinción integral de los subconjuntos de características compuestos por las K características anteriores seleccionadas por el algoritmo Relief a menudo es redundante, ya que el algoritmo no puede seleccionar el subconjunto de características ideal. Al calcular la correlación y la redundancia entre características mediante la información mutua, la velocidad de cálculo es lenta debido a la alta complejidad computacional y a la necesidad del método de calcular la función de densidad de probabilidad de las características correspondientes. Con el objetivo de resolver los problemas anteriores, primero mejoramos el peso del algoritmo Relief, de modo que pueda utilizarse para evaluar un conjunto de conjuntos de características candidatas. Luego, utilizamos la función de evaluación de información mutua conjunta mejorada para reemplazar el cálculo básico de información mutua y resolver el problema de la velocidad de cálculo, así como la correlación y la redundancia entre características. Finalmente, se propone un algoritmo de selección de características de correlación compuesta basado en Relief y en la información mutua conjunta utilizando la función de evaluación y la estrategia heurística de búsqueda secuencial hacia adelante. Este algoritmo puede seleccionar de manera efectiva subconjuntos de características con poca redundancia y fuertes características de clasificación, y tiene las excelentes características de una velocidad de cálculo más rápida.