Una técnica sintética de sobremuestreo basada en optimización de enjambre de partículas y buitre egipcio adaptada para el problema de desequilibrio de clases
Autores: Rout, Subhashree; Mallick, Pradeep Kumar; V. N. Reddy, Annapareddy; Kumar, Sachin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Una técnica sintética de sobremuestreo basada en optimización de enjambre de partículas y buitre egipcio adaptada para el problema de desequilibrio de clases
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Desbalance de clases
Problemas de clasificación
Muestras de datos
SMOTE
PSO
Buitre egipcio
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El desequilibrio de clases es uno de los desafíos significativos en los problemas de clasificación. La distribución desigual de muestras de datos en diferentes clases puede ocurrir debido a errores humanos, recolección inadecuada o no guiada de muestras de datos, etc. La distribución desigual de muestras de clase entre clases puede afectar la precisión de clasificación del modelo desarrollado. La principal motivación detrás de este estudio es el diseño y desarrollo de metodologías para abordar problemas de desequilibrio de clases. En este estudio, se ha propuesto una nueva variante de la técnica de sobremuestreo de minorías sintéticas (SMOTE) con la hibridación de optimización por enjambre de partículas (PSO) y buitre egipcio (EV). El método propuesto se ha denominado SMOTE-PSOEV en este estudio. El método propuesto genera un conjunto optimizado de muestras sintéticas a partir del SMOTE tradicional y aumenta los cinco conjuntos de datos para verificación y validación. El SMOTE-PSOEV se compara luego con variantes existentes de SMOTE, es decir, Tomek Link, Borderline SMOTE1, Borderline SMOTE2, Distance SMOTE y ADASYN. Después de la ampliación de datos a las clases minoritarias, se ha evaluado el rendimiento de SMOTE-PSOEV utilizando máquinas de soporte vectorial (SVM), Naïve Bayes (NB) y clasificadores de k-vecinos más cercanos (k-NN). Los resultados ilustran que los modelos propuestos lograron una mayor precisión que las variantes existentes de SMOTE.
Descripción
El desequilibrio de clases es uno de los desafíos significativos en los problemas de clasificación. La distribución desigual de muestras de datos en diferentes clases puede ocurrir debido a errores humanos, recolección inadecuada o no guiada de muestras de datos, etc. La distribución desigual de muestras de clase entre clases puede afectar la precisión de clasificación del modelo desarrollado. La principal motivación detrás de este estudio es el diseño y desarrollo de metodologías para abordar problemas de desequilibrio de clases. En este estudio, se ha propuesto una nueva variante de la técnica de sobremuestreo de minorías sintéticas (SMOTE) con la hibridación de optimización por enjambre de partículas (PSO) y buitre egipcio (EV). El método propuesto se ha denominado SMOTE-PSOEV en este estudio. El método propuesto genera un conjunto optimizado de muestras sintéticas a partir del SMOTE tradicional y aumenta los cinco conjuntos de datos para verificación y validación. El SMOTE-PSOEV se compara luego con variantes existentes de SMOTE, es decir, Tomek Link, Borderline SMOTE1, Borderline SMOTE2, Distance SMOTE y ADASYN. Después de la ampliación de datos a las clases minoritarias, se ha evaluado el rendimiento de SMOTE-PSOEV utilizando máquinas de soporte vectorial (SVM), Naïve Bayes (NB) y clasificadores de k-vecinos más cercanos (k-NN). Los resultados ilustran que los modelos propuestos lograron una mayor precisión que las variantes existentes de SMOTE.