Una comparación de técnicas de aprendizaje automático para la detección de diabetes mellitus tipo 2: experiencias de Bangladés
Autores: Uddin, Md. Jamal; Ahamad, Md. Martuza; Hoque, Md. Nesarul; Walid, Md. Abul Ala; Aktar, Sakifa; Alotaibi, Naif; Alyami, Salem A.; Kabir, Muhammad Ashad; Moni, Mohammad Ali
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Una comparación de técnicas de aprendizaje automático para la detección de diabetes mellitus tipo 2: experiencias de Bangladés
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Diabetes
Enfermedad crónica
Factores de riesgo
Técnicas de aprendizaje automático
Marco basado en conjuntos
Técnicas de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La diabetes es una enfermedad crónica causada por un nivel de azúcar en sangre persistentemente alto, lo que provoca otras enfermedades crónicas, incluyendo daño cardiovascular, renal, ocular y nervioso. La detección temprana juega un papel vital en la reducción del riesgo y la gravedad asociada con la diabetes, y la identificación de factores de riesgo clave puede ayudar a las personas a ser más conscientes de sus estilos de vida. En este estudio, realizamos una encuesta basada en cuestionarios utilizando variables de riesgo estándar de diabetes para examinar la prevalencia de la diabetes en Bangladesh. Para permitir la detección temprana de la diabetes, comparamos diferentes técnicas de aprendizaje automático y propusimos un marco de aprendizaje automático basado en conjuntos que incorporaba algoritmos como árbol de decisión, bosque aleatorio y algoritmos de aumento extremo de gradiente. Con el fin de abordar el desequilibrio de clases dentro del conjunto de datos, inicialmente aplicamos la técnica de sobremuestreo de minorías sintéticas (SMOTE) y técnicas de sobremuestreo aleatorio (ROS). Evaluamos el rendimiento de varios clasificadores, incluyendo árbol de decisión (DT), regresión logística (LR), máquina de soporte vectorial (SVM), aumento de gradiente (GB), aumento extremo de gradiente (XGBoost), bosque aleatorio (RF) y técnica de conjunto (ET), en nuestros conjuntos de datos de diabetes. Nuestros resultados experimentales mostraron que el ET superó a otros clasificadores; para mejorar aún más su efectividad, ajustamos y evaluamos los hiperparámetros del ET. Utilizando técnicas estadísticas y de aprendizaje automático, también clasificamos características e identificamos que la edad, la sed extrema y la diabetes en la familia son características significativas que resultan instrumentales en la detección de pacientes diabéticos. Este método tiene un gran potencial para que los clínicos identifiquen eficazmente a las personas en riesgo de diabetes, facilitando la intervención y atención oportuna.
Descripción
La diabetes es una enfermedad crónica causada por un nivel de azúcar en sangre persistentemente alto, lo que provoca otras enfermedades crónicas, incluyendo daño cardiovascular, renal, ocular y nervioso. La detección temprana juega un papel vital en la reducción del riesgo y la gravedad asociada con la diabetes, y la identificación de factores de riesgo clave puede ayudar a las personas a ser más conscientes de sus estilos de vida. En este estudio, realizamos una encuesta basada en cuestionarios utilizando variables de riesgo estándar de diabetes para examinar la prevalencia de la diabetes en Bangladesh. Para permitir la detección temprana de la diabetes, comparamos diferentes técnicas de aprendizaje automático y propusimos un marco de aprendizaje automático basado en conjuntos que incorporaba algoritmos como árbol de decisión, bosque aleatorio y algoritmos de aumento extremo de gradiente. Con el fin de abordar el desequilibrio de clases dentro del conjunto de datos, inicialmente aplicamos la técnica de sobremuestreo de minorías sintéticas (SMOTE) y técnicas de sobremuestreo aleatorio (ROS). Evaluamos el rendimiento de varios clasificadores, incluyendo árbol de decisión (DT), regresión logística (LR), máquina de soporte vectorial (SVM), aumento de gradiente (GB), aumento extremo de gradiente (XGBoost), bosque aleatorio (RF) y técnica de conjunto (ET), en nuestros conjuntos de datos de diabetes. Nuestros resultados experimentales mostraron que el ET superó a otros clasificadores; para mejorar aún más su efectividad, ajustamos y evaluamos los hiperparámetros del ET. Utilizando técnicas estadísticas y de aprendizaje automático, también clasificamos características e identificamos que la edad, la sed extrema y la diabetes en la familia son características significativas que resultan instrumentales en la detección de pacientes diabéticos. Este método tiene un gran potencial para que los clínicos identifiquen eficazmente a las personas en riesgo de diabetes, facilitando la intervención y atención oportuna.