Comparación de rendimiento de enfoques de aprendizaje automático en la predicción de hepatitis C empleando técnicas de minería de datos
Autores: Alizargar, Azadeh; Chang, Yang-Lang; Tan, Tan-Hsu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Comparación de rendimiento de enfoques de aprendizaje automático en la predicción de hepatitis C empleando técnicas de minería de datos
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Hepatitis c
Técnicas de aprendizaje automático
Datos de pruebas de sangre
Daño hepático
Predicción
SVM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La hepatitis C es una infección hepática causada por el virus de la hepatitis C (VHC). Debido al inicio tardío de los síntomas, el diagnóstico temprano es difícil en esta enfermedad. La predicción eficiente puede salvar a los pacientes antes de que se produzcan daños permanentes en el hígado. El objetivo principal de este estudio es emplear diversas técnicas de aprendizaje automático para predecir esta enfermedad basándose en datos comunes y asequibles de pruebas de sangre para diagnosticar y tratar a los pacientes en las primeras etapas. En este estudio, se utilizaron seis algoritmos de aprendizaje automático (Máquina de Vectores de Soporte (SVM), K-vecinos más cercanos (KNN), Regresión Logística, árbol de decisión, aumento extremo de gradiente (XGBoost), redes neuronales artificiales (ANN)) en dos conjuntos de datos. El rendimiento de estas técnicas se comparó en términos de matriz de confusión, precisión, recuperación, puntuación F1, exactitud, características de operación del receptor (ROC) y el área bajo la curva (AUC) para identificar un método apropiado para predecir esta enfermedad. El análisis, en los conjuntos de datos de NHANES y UCI, reveló que SVM y XGBoost (con la mayor precisión y AUC entre los modelos de prueba, >80%) pueden ser herramientas efectivas para los profesionales médicos que utilizan datos comunes y asequibles de pruebas de sangre para predecir la hepatitis C.
Descripción
La hepatitis C es una infección hepática causada por el virus de la hepatitis C (VHC). Debido al inicio tardío de los síntomas, el diagnóstico temprano es difícil en esta enfermedad. La predicción eficiente puede salvar a los pacientes antes de que se produzcan daños permanentes en el hígado. El objetivo principal de este estudio es emplear diversas técnicas de aprendizaje automático para predecir esta enfermedad basándose en datos comunes y asequibles de pruebas de sangre para diagnosticar y tratar a los pacientes en las primeras etapas. En este estudio, se utilizaron seis algoritmos de aprendizaje automático (Máquina de Vectores de Soporte (SVM), K-vecinos más cercanos (KNN), Regresión Logística, árbol de decisión, aumento extremo de gradiente (XGBoost), redes neuronales artificiales (ANN)) en dos conjuntos de datos. El rendimiento de estas técnicas se comparó en términos de matriz de confusión, precisión, recuperación, puntuación F1, exactitud, características de operación del receptor (ROC) y el área bajo la curva (AUC) para identificar un método apropiado para predecir esta enfermedad. El análisis, en los conjuntos de datos de NHANES y UCI, reveló que SVM y XGBoost (con la mayor precisión y AUC entre los modelos de prueba, >80%) pueden ser herramientas efectivas para los profesionales médicos que utilizan datos comunes y asequibles de pruebas de sangre para predecir la hepatitis C.