Un Nuevo Método de Selección de Características de Conjunto MBPSO-BDGWO para Datos de Clasificación de Alta Dimensionalidad
Autores: Sancar, Nuriye
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un Nuevo Método de Selección de Características de Conjunto MBPSO-BDGWO para Datos de Clasificación de Alta Dimensionalidad
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Clasificación
Selección de características
Método de conjunto
Alta dimensión
Metaheurística
Simulación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En un conjunto de datos de clasificación de alta dimensión, la selección de características es crucial para mejorar el rendimiento de clasificación y la eficiencia computacional al identificar un subconjunto informativo de características mientras se reduce el ruido, la redundancia y el sobreajuste. Este estudio propone un nuevo enfoque de selección de características en conjunto basado en metaheurísticas al combinar las fortalezas complementarias de la Optimización por Enjambre de Partículas Binarias Modificada (MBPSO) y la Optimización de Lobos Grises Dinámicos Binarios (BDGWO). El método de conjunto MBPSO-BDGWO propuesto está diseñado específicamente para problemas de clasificación de alta dimensión. El rendimiento del método de conjunto MBPSO-BDGWO propuesto fue evaluado rigurosamente a través de un extenso estudio de simulación bajo múltiples escenarios de alta dimensión con diferentes estructuras de correlación. El método de conjunto fue validado además en varios conjuntos de datos reales. Se realizaron análisis comparativos contra métodos de selección de características de una sola etapa, incluyendo BPSO, BGWO, MBPSO y BDGWO, utilizando métricas de evaluación como precisión, la puntuación F1, la tasa de verdaderos positivos (TPR), la tasa de falsos positivos (FPR), el AUC, precisión y el índice de estabilidad de Jaccard. Los estudios de simulación realizados bajo varios escenarios de dimensionalidad y correlación muestran que el método de conjunto propuesto logra una baja FPR, una alta TPR/Precisión/F1/AUC y una fuerte estabilidad de selección, superando claramente tanto a los métodos clásicos como a los avanzados de una sola etapa, incluso a medida que aumentan la dimensionalidad y la colinealidad. En contraste, los métodos de una sola etapa suelen experimentar una degradación sustancial del rendimiento en entornos de alta correlación y alta dimensión, particularmente BPSO y BGWO. Además, en los conjuntos de datos reales, el método de conjunto superó a todos los métodos de una sola etapa comparados y produjo consistentemente bajos valores de MAD a través de repeticiones, lo que indica robustez y estabilidad incluso en conjuntos de datos genómicos ultra-altamente dimensionales. En general, los hallazgos indican que el método de conjunto propuesto demuestra un rendimiento consistente en los escenarios evaluados y logra una mayor estabilidad de selección en comparación con los métodos de una sola etapa.
Descripción
En un conjunto de datos de clasificación de alta dimensión, la selección de características es crucial para mejorar el rendimiento de clasificación y la eficiencia computacional al identificar un subconjunto informativo de características mientras se reduce el ruido, la redundancia y el sobreajuste. Este estudio propone un nuevo enfoque de selección de características en conjunto basado en metaheurísticas al combinar las fortalezas complementarias de la Optimización por Enjambre de Partículas Binarias Modificada (MBPSO) y la Optimización de Lobos Grises Dinámicos Binarios (BDGWO). El método de conjunto MBPSO-BDGWO propuesto está diseñado específicamente para problemas de clasificación de alta dimensión. El rendimiento del método de conjunto MBPSO-BDGWO propuesto fue evaluado rigurosamente a través de un extenso estudio de simulación bajo múltiples escenarios de alta dimensión con diferentes estructuras de correlación. El método de conjunto fue validado además en varios conjuntos de datos reales. Se realizaron análisis comparativos contra métodos de selección de características de una sola etapa, incluyendo BPSO, BGWO, MBPSO y BDGWO, utilizando métricas de evaluación como precisión, la puntuación F1, la tasa de verdaderos positivos (TPR), la tasa de falsos positivos (FPR), el AUC, precisión y el índice de estabilidad de Jaccard. Los estudios de simulación realizados bajo varios escenarios de dimensionalidad y correlación muestran que el método de conjunto propuesto logra una baja FPR, una alta TPR/Precisión/F1/AUC y una fuerte estabilidad de selección, superando claramente tanto a los métodos clásicos como a los avanzados de una sola etapa, incluso a medida que aumentan la dimensionalidad y la colinealidad. En contraste, los métodos de una sola etapa suelen experimentar una degradación sustancial del rendimiento en entornos de alta correlación y alta dimensión, particularmente BPSO y BGWO. Además, en los conjuntos de datos reales, el método de conjunto superó a todos los métodos de una sola etapa comparados y produjo consistentemente bajos valores de MAD a través de repeticiones, lo que indica robustez y estabilidad incluso en conjuntos de datos genómicos ultra-altamente dimensionales. En general, los hallazgos indican que el método de conjunto propuesto demuestra un rendimiento consistente en los escenarios evaluados y logra una mayor estabilidad de selección en comparación con los métodos de una sola etapa.