Bosque Aleatorio con Técnicas de Muestreo para Manejar la Predicción Desbalanceada de la Depresión en Estudiantes Universitarios
Autores: Sawangarreerak, Siriporn; Thanathamathee, Putthiporn
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Bosque Aleatorio con Técnicas de Muestreo para Manejar la Predicción Desbalanceada de la Depresión en Estudiantes Universitarios
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Técnica de muestreo combinada
Clasificación desbalanceada
Datos de depresión
Sobremuestreo aleatorio
Enlaces de Tomek
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este trabajo, proponemos una técnica de muestreo combinada para mejorar el rendimiento de la clasificación desbalanceada de datos sobre la depresión en estudiantes universitarios. En los resultados experimentales, encontramos que la combinación de sobre-muestreo aleatorio con los métodos de sub-muestreo de enlaces de Tomek permitió generar un conjunto de datos de depresión relativamente equilibrado sin perder información significativa. En este caso, se utilizó la técnica de sobre-muestreo aleatorio para muestrear la clase minoritaria y equilibrar el número de muestras entre los conjuntos de datos. Luego, se utilizó la técnica de enlaces de Tomek para sub-muestrear las muestras eliminando los datos de depresión considerados menos relevantes y ruidosos. El conjunto de datos relativamente equilibrado fue clasificado por un bosque aleatorio. Los resultados muestran que la precisión general en la predicción de datos sobre la depresión adolescente fue del 94.17%, superando la técnica de muestreo individual. Además, nuestro método propuesto fue probado con otro conjunto de datos para su validez externa. Se encontró que la precisión predictiva de este conjunto de datos era del 93.33%.
Descripción
En este trabajo, proponemos una técnica de muestreo combinada para mejorar el rendimiento de la clasificación desbalanceada de datos sobre la depresión en estudiantes universitarios. En los resultados experimentales, encontramos que la combinación de sobre-muestreo aleatorio con los métodos de sub-muestreo de enlaces de Tomek permitió generar un conjunto de datos de depresión relativamente equilibrado sin perder información significativa. En este caso, se utilizó la técnica de sobre-muestreo aleatorio para muestrear la clase minoritaria y equilibrar el número de muestras entre los conjuntos de datos. Luego, se utilizó la técnica de enlaces de Tomek para sub-muestrear las muestras eliminando los datos de depresión considerados menos relevantes y ruidosos. El conjunto de datos relativamente equilibrado fue clasificado por un bosque aleatorio. Los resultados muestran que la precisión general en la predicción de datos sobre la depresión adolescente fue del 94.17%, superando la técnica de muestreo individual. Además, nuestro método propuesto fue probado con otro conjunto de datos para su validez externa. Se encontró que la precisión predictiva de este conjunto de datos era del 93.33%.