Un Perceptrón Multicapa Híbrido de Submuestreo con Bagging que Trata con un Conjunto de Datos de Arroz Desbalanceado en la Vida Real
Autores: Diallo, Moussa; Xiong, Shengwu; Emiru, Eshete Derb; Fesseha, Awet; Abdulsalami, Aminu Onimisi; Elaziz, Mohamed Abd
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un Perceptrón Multicapa Híbrido de Submuestreo con Bagging que Trata con un Conjunto de Datos de Arroz Desbalanceado en la Vida Real
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Algoritmos de clasificación
Conjuntos de datos de la vida real
Desequilibrio de clases
Aprendizaje en conjunto
MLPUS
Conjuntos de datos desequilibrados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los algoritmos de clasificación han mostrado resultados de predicción excepcionales en el área del aprendizaje supervisado. Estos algoritmos de clasificación no siempre son eficientes cuando se trata de conjuntos de datos de la vida real debido a las distribuciones de clases. Como resultado, los conjuntos de datos para aplicaciones de la vida real son generalmente desbalanceados. Se han propuesto varios métodos para resolver el problema del desbalance de clases. En este artículo, proponemos un método híbrido que combina las técnicas de preprocesamiento y las de aprendizaje en conjunto. El conjunto de entrenamiento original se submuestrea evaluando las muestras mediante medición estocástica (SM) y luego entrenando estas muestras seleccionadas con un Perceptrón Multicapa para devolver un conjunto de entrenamiento balanceado. El conjunto de entrenamiento balanceado MLPUS (submuestreo de perceptrón multicapa) se agrega utilizando el método de conjunto de bagging. Aplicamos nuestro método al conjunto de datos de la vida real Niger_Rice y a otros cuarenta y cuatro conjuntos de datos desbalanceados del repositorio KEEL en este estudio. También comparamos nuestro método con seis otros métodos existentes en la literatura, como el clasificador MLP en el conjunto de datos desbalanceado original, MLPUS, UnderBagging (combinando submuestreo aleatorio y bagging), RUSBoost, SMOTEBagging (Técnica de Sobremuestreo de Minorías Sintéticas y bagging), SMOTEBoost. Los resultados muestran que nuestro método es competitivo en comparación con otros métodos. Los resultados del conjunto de datos de la vida real Niger_Rice son 75.6, 0.73, 0.76 y 0.86, respectivamente, para precisión, medida F, G-media y ROC con nuestro método propuesto. En contraste, el clasificador MLP en el conjunto de datos desbalanceado original Niger_Rice da resultados de 72.44, 0.82, 0.59 y 0.76 respectivamente para precisión, medida F, G-media y ROC.
Descripción
Los algoritmos de clasificación han mostrado resultados de predicción excepcionales en el área del aprendizaje supervisado. Estos algoritmos de clasificación no siempre son eficientes cuando se trata de conjuntos de datos de la vida real debido a las distribuciones de clases. Como resultado, los conjuntos de datos para aplicaciones de la vida real son generalmente desbalanceados. Se han propuesto varios métodos para resolver el problema del desbalance de clases. En este artículo, proponemos un método híbrido que combina las técnicas de preprocesamiento y las de aprendizaje en conjunto. El conjunto de entrenamiento original se submuestrea evaluando las muestras mediante medición estocástica (SM) y luego entrenando estas muestras seleccionadas con un Perceptrón Multicapa para devolver un conjunto de entrenamiento balanceado. El conjunto de entrenamiento balanceado MLPUS (submuestreo de perceptrón multicapa) se agrega utilizando el método de conjunto de bagging. Aplicamos nuestro método al conjunto de datos de la vida real Niger_Rice y a otros cuarenta y cuatro conjuntos de datos desbalanceados del repositorio KEEL en este estudio. También comparamos nuestro método con seis otros métodos existentes en la literatura, como el clasificador MLP en el conjunto de datos desbalanceado original, MLPUS, UnderBagging (combinando submuestreo aleatorio y bagging), RUSBoost, SMOTEBagging (Técnica de Sobremuestreo de Minorías Sintéticas y bagging), SMOTEBoost. Los resultados muestran que nuestro método es competitivo en comparación con otros métodos. Los resultados del conjunto de datos de la vida real Niger_Rice son 75.6, 0.73, 0.76 y 0.86, respectivamente, para precisión, medida F, G-media y ROC con nuestro método propuesto. En contraste, el clasificador MLP en el conjunto de datos desbalanceado original Niger_Rice da resultados de 72.44, 0.82, 0.59 y 0.76 respectivamente para precisión, medida F, G-media y ROC.