Predicción de covid-19 aplicando algoritmos de aprendizaje supervisado con análisis comparativo utilizando WEKA
Autores: Villavicencio, Charlyn Nayve; Macrohon, Julio Jerison Escudero; Inbaraj, Xavier Alphonse; Jeng, Jyh-Horng; Hsieh, Jer-Guang
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Predicción de covid-19 aplicando algoritmos de aprendizaje supervisado con análisis comparativo utilizando WEKA
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Diagnóstico
Enfermedad
COVID-19
Tecnología
Minería de datos
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
El diagnóstico temprano es crucial para prevenir el desarrollo de una enfermedad que puede causar peligro a la vida humana. COVID-19, que es una enfermedad contagiosa que ha mutado en varias variantes, se ha convertido en una pandemia global que exige ser diagnosticada lo antes posible. Con el uso de la tecnología, la información disponible sobre COVID-19 aumenta cada día, y extraer información útil de datos masivos se puede hacer a través de la minería de datos. En este estudio, los autores utilizaron varios algoritmos supervisados de aprendizaje automático para construir un modelo que analizara y predijera la presencia de COVID-19 utilizando el conjunto de datos de Síntomas y Presencia de COVID-19 de Kaggle. Se aplicaron los algoritmos Árbol de Decisión J48, Bosque Aleatorio, Máquina de Vectores de Soporte, Vecinos más Cercanos de K y Bayes Ingenuo a través del software de aprendizaje automático WEKA. El rendimiento de cada modelo fue evaluado utilizando validación cruzada de 10 pliegues y comparado según las principales medidas de precisión, instancias clasificadas correctamente o incorrectamente, kappa, error absoluto medio y tiempo necesario para construir el modelo. Los resultados muestran que la Máquina de Vectores de Soporte utilizando el núcleo universal de Pearson VII supera a otros algoritmos al lograr una precisión del 98.81% y un error absoluto medio de 0.012.
Descripción
El diagnóstico temprano es crucial para prevenir el desarrollo de una enfermedad que puede causar peligro a la vida humana. COVID-19, que es una enfermedad contagiosa que ha mutado en varias variantes, se ha convertido en una pandemia global que exige ser diagnosticada lo antes posible. Con el uso de la tecnología, la información disponible sobre COVID-19 aumenta cada día, y extraer información útil de datos masivos se puede hacer a través de la minería de datos. En este estudio, los autores utilizaron varios algoritmos supervisados de aprendizaje automático para construir un modelo que analizara y predijera la presencia de COVID-19 utilizando el conjunto de datos de Síntomas y Presencia de COVID-19 de Kaggle. Se aplicaron los algoritmos Árbol de Decisión J48, Bosque Aleatorio, Máquina de Vectores de Soporte, Vecinos más Cercanos de K y Bayes Ingenuo a través del software de aprendizaje automático WEKA. El rendimiento de cada modelo fue evaluado utilizando validación cruzada de 10 pliegues y comparado según las principales medidas de precisión, instancias clasificadas correctamente o incorrectamente, kappa, error absoluto medio y tiempo necesario para construir el modelo. Los resultados muestran que la Máquina de Vectores de Soporte utilizando el núcleo universal de Pearson VII supera a otros algoritmos al lograr una precisión del 98.81% y un error absoluto medio de 0.012.