Optimización estratégica del aprendizaje automático para la predicción de enfermedades cardiovasculares e identificación de pacientes de alto riesgo
Autores: Tompra, Konstantina-Vasiliki; Papageorgiou, George; Tjortjis, Christos
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Optimización estratégica del aprendizaje automático para la predicción de enfermedades cardiovasculares e identificación de pacientes de alto riesgo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Avances médicos
Enfermedades cardiovasculares
Aprendizaje automático
Técnicas de remuestreo
Clasificadores
Predicción de riesgo de ECV
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
A pesar de los avances médicos en los últimos años, las enfermedades cardiovasculares (ECVs) siguen siendo un factor importante en el aumento de las tasas de mortalidad, desafiando las predicciones a pesar de la extensa experiencia. El sector de la salud está preparado para beneficiarse significativamente al aprovechar los datos masivos y las ideas que podemos derivar de ellos, subrayando la importancia de integrar el aprendizaje automático (ML) para mejorar las estrategias de prevención de las ECV. En este estudio, abordamos el importante problema del desequilibrio de clases en el conjunto de datos de enfermedades cardíacas de Behavioral Risk Factor Surveillance System (BRFSS) 2021, incluidos factores de estilo de vida personal, explorando varias técnicas de re-muestreo, como la Técnica de Sobremuestreo Minoritario Sintético (SMOTE), Muestreo Sintético Adaptativo (ADASYN), SMOTE-Tomek y SMOTE-Edited Nearest Neighbor (SMOTE-ENN). Posteriormente, entrenamos, probamos y evaluamos múltiples clasificadores, incluidos la regresión logística (LR), árboles de decisión (DTs), bosques aleatorios (RF), aumento de gradiente (GB), XGBoost (XGB), CatBoost y redes neuronales artificiales (ANNs), comparando su rendimiento con un enfoque principal en maximizar la sensibilidad para la predicción del riesgo de ECV. Según nuestros hallazgos, las técnicas de re-muestreo híbridas superaron a las técnicas de muestreo alternativas, y nuestra implementación propuesta incluye SMOTE-ENN junto con CatBoost optimizado a través de Optuna, logrando una notable tasa del 88% para la recuperación y del 82% para el área bajo la curva característica de operación del receptor (ROC) (AUC).
Descripción
A pesar de los avances médicos en los últimos años, las enfermedades cardiovasculares (ECVs) siguen siendo un factor importante en el aumento de las tasas de mortalidad, desafiando las predicciones a pesar de la extensa experiencia. El sector de la salud está preparado para beneficiarse significativamente al aprovechar los datos masivos y las ideas que podemos derivar de ellos, subrayando la importancia de integrar el aprendizaje automático (ML) para mejorar las estrategias de prevención de las ECV. En este estudio, abordamos el importante problema del desequilibrio de clases en el conjunto de datos de enfermedades cardíacas de Behavioral Risk Factor Surveillance System (BRFSS) 2021, incluidos factores de estilo de vida personal, explorando varias técnicas de re-muestreo, como la Técnica de Sobremuestreo Minoritario Sintético (SMOTE), Muestreo Sintético Adaptativo (ADASYN), SMOTE-Tomek y SMOTE-Edited Nearest Neighbor (SMOTE-ENN). Posteriormente, entrenamos, probamos y evaluamos múltiples clasificadores, incluidos la regresión logística (LR), árboles de decisión (DTs), bosques aleatorios (RF), aumento de gradiente (GB), XGBoost (XGB), CatBoost y redes neuronales artificiales (ANNs), comparando su rendimiento con un enfoque principal en maximizar la sensibilidad para la predicción del riesgo de ECV. Según nuestros hallazgos, las técnicas de re-muestreo híbridas superaron a las técnicas de muestreo alternativas, y nuestra implementación propuesta incluye SMOTE-ENN junto con CatBoost optimizado a través de Optuna, logrando una notable tasa del 88% para la recuperación y del 82% para el área bajo la curva característica de operación del receptor (ROC) (AUC).