Aprovechando técnicas de aprendizaje automático para predecir enfermedades cardiovasculares del corazón
Autores: Baar, Remzi; Ocak, Öznur; Erturk, Alper; de la Roche, Marcelle
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Aprovechando técnicas de aprendizaje automático para predecir enfermedades cardiovasculares del corazón
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Enfermedades cardiovasculares
Impulsado por datos
Red neuronal artificial
Predicción de enfermedades del corazón
Análisis SHAP
Creatinina sérica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las enfermedades cardiovasculares (ECV) siguen siendo la principal causa de muerte a nivel mundial, lo que subraya la necesidad urgente de herramientas de diagnóstico temprano basadas en datos. Este estudio propone un modelo de red neuronal artificial (RNA) multicapa para la predicción de enfermedades cardíacas, desarrollado utilizando un conjunto de datos clínicos del mundo real que comprende 13,981 registros de pacientes. Implementado en la plataforma de minería de datos Orange, la RNA fue entrenada utilizando retropropagación y validada a través de validación cruzada de 10 pliegues. La reducción de dimensionalidad mediante análisis de componentes principales (PCA) mejoró la eficiencia computacional, mientras que las explicaciones aditivas de Shapley (SHAP) se utilizaron para interpretar las salidas del modelo. A pesar de lograr una precisión del 83.4% y una alta especificidad, el modelo mostró una baja sensibilidad a los casos de enfermedad, identificando solo 76 de 2233 muestras positivas, con un coeficiente de correlación de Matthews (MCC) de 0.058. Los puntos de referencia comparativos mostraron que el bosque aleatorio y las máquinas de soporte vectorial superaron significativamente a la RNA en términos de discriminación (AUC hasta 91.6%). El análisis SHAP reveló que los niveles de creatinina sérica, diabetes y hemoglobina son los principales predictores. Para abordar las limitaciones del estudio actual, trabajos futuros explorarán LIME, Grad-CAM y técnicas de ensamblaje como XGBoost para mejorar la interpretabilidad y el equilibrio. Esta investigación enfatiza la importancia de la explicabilidad, la representatividad de los datos y la evaluación robusta en el desarrollo de herramientas de IA clínicamente confiables para la detección de enfermedades cardíacas.
Descripción
Las enfermedades cardiovasculares (ECV) siguen siendo la principal causa de muerte a nivel mundial, lo que subraya la necesidad urgente de herramientas de diagnóstico temprano basadas en datos. Este estudio propone un modelo de red neuronal artificial (RNA) multicapa para la predicción de enfermedades cardíacas, desarrollado utilizando un conjunto de datos clínicos del mundo real que comprende 13,981 registros de pacientes. Implementado en la plataforma de minería de datos Orange, la RNA fue entrenada utilizando retropropagación y validada a través de validación cruzada de 10 pliegues. La reducción de dimensionalidad mediante análisis de componentes principales (PCA) mejoró la eficiencia computacional, mientras que las explicaciones aditivas de Shapley (SHAP) se utilizaron para interpretar las salidas del modelo. A pesar de lograr una precisión del 83.4% y una alta especificidad, el modelo mostró una baja sensibilidad a los casos de enfermedad, identificando solo 76 de 2233 muestras positivas, con un coeficiente de correlación de Matthews (MCC) de 0.058. Los puntos de referencia comparativos mostraron que el bosque aleatorio y las máquinas de soporte vectorial superaron significativamente a la RNA en términos de discriminación (AUC hasta 91.6%). El análisis SHAP reveló que los niveles de creatinina sérica, diabetes y hemoglobina son los principales predictores. Para abordar las limitaciones del estudio actual, trabajos futuros explorarán LIME, Grad-CAM y técnicas de ensamblaje como XGBoost para mejorar la interpretabilidad y el equilibrio. Esta investigación enfatiza la importancia de la explicabilidad, la representatividad de los datos y la evaluación robusta en el desarrollo de herramientas de IA clínicamente confiables para la detección de enfermedades cardíacas.