Un metodología efectiva para la predicción de la diabetes en el caso de desequilibrio de clases
Autores: Toleva, Borislava; Atanasov, Ivan; Ivanov, Ivan; Hooper, Vincent
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un metodología efectiva para la predicción de la diabetes en el caso de desequilibrio de clases
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Diabetes
Azúcar en la sangre
Clasificación
Desequilibrio
Metodología
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
La diabetes provoca un aumento en el nivel de azúcar en la sangre, lo que conduce al daño de varias partes del cuerpo humano. Los datos sobre la diabetes se utilizan no solo para proporcionar una comprensión más profunda de los mecanismos de tratamiento, sino también para predecir la probabilidad de que alguien pueda enfermarse. Este documento propone una metodología novedosa para realizar clasificaciones en casos de desequilibrio de clases, como se observa en el conjunto de datos de diabetes PIMA. La metodología propuesta utiliza dos pasos novedosos, a saber, el remuestreo y la mezcla aleatoria antes de definir el modelo de clasificación. La metodología se prueba con dos versiones de validación cruzada apropiadas en casos de desequilibrio de clases: validación cruzada k-fold y validación cruzada estratificada k-fold. Nuestros hallazgos sugieren que al tener datos desequilibrados, mezclar los datos aleatoriamente antes de una división de entrenamiento/prueba puede ayudar a mejorar las métricas de estimación. Nuestra metodología puede superar a los algoritmos de aprendizaje automático existentes y a los modelos complejos de aprendizaje profundo. Aplicar nuestra metodología propuesta es una forma simple y rápida de predecir etiquetas con desequilibrio de clases. No requiere técnicas adicionales para equilibrar las clases. No implica preseleccionar variables importantes, lo que ahorra tiempo y hace que el modelo sea fácil de analizar. Esto lo convierte en una metodología efectiva para el modelado inicial y posterior de datos con desequilibrio de clases. Además, nuestras metodologías muestran cómo aumentar la efectividad de los modelos de aprendizaje automático basados en enfoques estándar y hacerlos más confiables.
Descripción
La diabetes provoca un aumento en el nivel de azúcar en la sangre, lo que conduce al daño de varias partes del cuerpo humano. Los datos sobre la diabetes se utilizan no solo para proporcionar una comprensión más profunda de los mecanismos de tratamiento, sino también para predecir la probabilidad de que alguien pueda enfermarse. Este documento propone una metodología novedosa para realizar clasificaciones en casos de desequilibrio de clases, como se observa en el conjunto de datos de diabetes PIMA. La metodología propuesta utiliza dos pasos novedosos, a saber, el remuestreo y la mezcla aleatoria antes de definir el modelo de clasificación. La metodología se prueba con dos versiones de validación cruzada apropiadas en casos de desequilibrio de clases: validación cruzada k-fold y validación cruzada estratificada k-fold. Nuestros hallazgos sugieren que al tener datos desequilibrados, mezclar los datos aleatoriamente antes de una división de entrenamiento/prueba puede ayudar a mejorar las métricas de estimación. Nuestra metodología puede superar a los algoritmos de aprendizaje automático existentes y a los modelos complejos de aprendizaje profundo. Aplicar nuestra metodología propuesta es una forma simple y rápida de predecir etiquetas con desequilibrio de clases. No requiere técnicas adicionales para equilibrar las clases. No implica preseleccionar variables importantes, lo que ahorra tiempo y hace que el modelo sea fácil de analizar. Esto lo convierte en una metodología efectiva para el modelado inicial y posterior de datos con desequilibrio de clases. Además, nuestras metodologías muestran cómo aumentar la efectividad de los modelos de aprendizaje automático basados en enfoques estándar y hacerlos más confiables.