Un modelo de predicción de enfermedades del corazón basado en la optimización de características y el algoritmo Smote-Xgboost
Autores: Yang, Jian; Guan, Jinhan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un modelo de predicción de enfermedades del corazón basado en la optimización de características y el algoritmo Smote-Xgboost
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Enfermedad cardíaca
Diagnóstico
Aprendizaje automático
Selección de características
Algoritmo smote-xgboost
Predicción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En el mundo actual, la enfermedad cardíaca es la principal causa de muerte a nivel mundial. Los investigadores han propuesto varios métodos destinados a mejorar la precisión y eficiencia del diagnóstico clínico de la enfermedad cardíaca. Los sistemas de diagnóstico auxiliares basados en aprendizaje automático están diseñados para aprender y predecir el estado de la enfermedad de los pacientes a partir de una gran cantidad de datos patológicos. La práctica ha demostrado que dicho sistema tiene el potencial de salvar más vidas. Por lo tanto, este documento propone un nuevo marco para predecir la enfermedad cardíaca utilizando el algoritmo smote-xgboost. Primero, proponemos un método de selección de características basado en la ganancia de información, que tiene como objetivo extraer características clave del conjunto de datos y prevenir el sobreajuste del modelo. En segundo lugar, utilizamos el algoritmo Smote-Enn para procesar datos desbalanceados y obtener datos de muestra con categorías positivas y negativas aproximadamente iguales. Finalmente, probamos el efecto de predicción del algoritmo Xgboost y cinco otros algoritmos de referencia en los datos de muestra. Los resultados muestran que nuestro método propuesto logra el mejor rendimiento en los cinco indicadores de precisión, exactitud, recuperación, puntuación F1 y AUC, y el marco propuesto en este documento tiene ventajas significativas en la predicción de enfermedades cardíacas.
Descripción
En el mundo actual, la enfermedad cardíaca es la principal causa de muerte a nivel mundial. Los investigadores han propuesto varios métodos destinados a mejorar la precisión y eficiencia del diagnóstico clínico de la enfermedad cardíaca. Los sistemas de diagnóstico auxiliares basados en aprendizaje automático están diseñados para aprender y predecir el estado de la enfermedad de los pacientes a partir de una gran cantidad de datos patológicos. La práctica ha demostrado que dicho sistema tiene el potencial de salvar más vidas. Por lo tanto, este documento propone un nuevo marco para predecir la enfermedad cardíaca utilizando el algoritmo smote-xgboost. Primero, proponemos un método de selección de características basado en la ganancia de información, que tiene como objetivo extraer características clave del conjunto de datos y prevenir el sobreajuste del modelo. En segundo lugar, utilizamos el algoritmo Smote-Enn para procesar datos desbalanceados y obtener datos de muestra con categorías positivas y negativas aproximadamente iguales. Finalmente, probamos el efecto de predicción del algoritmo Xgboost y cinco otros algoritmos de referencia en los datos de muestra. Los resultados muestran que nuestro método propuesto logra el mejor rendimiento en los cinco indicadores de precisión, exactitud, recuperación, puntuación F1 y AUC, y el marco propuesto en este documento tiene ventajas significativas en la predicción de enfermedades cardíacas.