logo móvil
Contáctanos

Una técnica sintética de sobremuestreo basada en optimización de enjambre de partículas y buitre egipcio adaptada para el problema de desequilibrio de clases

Autores: Rout, Subhashree; Mallick, Pradeep Kumar; V. N. Reddy, Annapareddy; Kumar, Sachin

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Una técnica sintética de sobremuestreo basada en optimización de enjambre de partículas y buitre egipcio adaptada para el problema de desequilibrio de clases


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Desbalance de clases
Problemas de clasificación
Muestras de datos
SMOTE
PSO
Buitre egipcio

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El desequilibrio de clases es uno de los desafíos significativos en los problemas de clasificación. La distribución desigual de muestras de datos en diferentes clases puede ocurrir debido a errores humanos, recolección inadecuada o no guiada de muestras de datos, etc. La distribución desigual de muestras de clase entre clases puede afectar la precisión de clasificación del modelo desarrollado. La principal motivación detrás de este estudio es el diseño y desarrollo de metodologías para abordar problemas de desequilibrio de clases. En este estudio, se ha propuesto una nueva variante de la técnica de sobremuestreo de minorías sintéticas (SMOTE) con la hibridación de optimización por enjambre de partículas (PSO) y buitre egipcio (EV). El método propuesto se ha denominado SMOTE-PSOEV en este estudio. El método propuesto genera un conjunto optimizado de muestras sintéticas a partir del SMOTE tradicional y aumenta los cinco conjuntos de datos para verificación y validación. El SMOTE-PSOEV se compara luego con variantes existentes de SMOTE, es decir, Tomek Link, Borderline SMOTE1, Borderline SMOTE2, Distance SMOTE y ADASYN. Después de la ampliación de datos a las clases minoritarias, se ha evaluado el rendimiento de SMOTE-PSOEV utilizando máquinas de soporte vectorial (SVM), Naïve Bayes (NB) y clasificadores de k-vecinos más cercanos (k-NN). Los resultados ilustran que los modelos propuestos lograron una mayor precisión que las variantes existentes de SMOTE.

Otros recursos que podrían interesarte

Temas Virtualpro