Análisis predictivo de síntomas de COVID-19 en redes sociales a través de aprendizaje automático
Autores: Silva, Clístenes Fernandes da; Junior, Arnaldo Candido; Lopes, Rui Pedro
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Análisis predictivo de síntomas de COVID-19 en redes sociales a través de aprendizaje automático
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes sociales
Análisis de datos
Síntomas de enfermedades
Algoritmos de aprendizaje automático
COVID-19
Organización Mundial de la Salud
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Las redes sociales son una gran fuente de datos para análisis, ya que proporcionan formas para que las personas compartan emociones, sentimientos, ideas e incluso síntomas de enfermedades. Al final de 2019, se emitió una alerta global de pandemia, relacionada con un virus que tenía una alta tasa de contagio y podía causar complicaciones respiratorias. Para ayudar a identificar a aquellos que puedan tener los síntomas de esta enfermedad o detectar quién ya está infectado, este artículo analizó el rendimiento de ocho algoritmos de aprendizaje automático (KNN, Naive Bayes, Árbol de Decisión, Bosque Aleatorio, SVM, Perceptrón Multicapa simple, Redes Neuronales Convolucionales y BERT) en la búsqueda y clasificación de tweets que mencionan autorreportes de síntomas de COVID-19. El conjunto de datos fue etiquetado utilizando un conjunto de palabras clave de síntomas de enfermedades proporcionadas por la Organización Mundial de la Salud. Los tests mostraron que el algoritmo de Bosque Aleatorio tuvo los mejores resultados, seguido de cerca por BERT y Red Neuronal Convolucional, aunque los algoritmos tradicionales de aprendizaje automático también pueden proporcionar buenos resultados. Este trabajo también podría ayudar en la selección de algoritmos en la identificación de síntomas de enfermedades en el contenido de redes sociales.
Descripción
Las redes sociales son una gran fuente de datos para análisis, ya que proporcionan formas para que las personas compartan emociones, sentimientos, ideas e incluso síntomas de enfermedades. Al final de 2019, se emitió una alerta global de pandemia, relacionada con un virus que tenía una alta tasa de contagio y podía causar complicaciones respiratorias. Para ayudar a identificar a aquellos que puedan tener los síntomas de esta enfermedad o detectar quién ya está infectado, este artículo analizó el rendimiento de ocho algoritmos de aprendizaje automático (KNN, Naive Bayes, Árbol de Decisión, Bosque Aleatorio, SVM, Perceptrón Multicapa simple, Redes Neuronales Convolucionales y BERT) en la búsqueda y clasificación de tweets que mencionan autorreportes de síntomas de COVID-19. El conjunto de datos fue etiquetado utilizando un conjunto de palabras clave de síntomas de enfermedades proporcionadas por la Organización Mundial de la Salud. Los tests mostraron que el algoritmo de Bosque Aleatorio tuvo los mejores resultados, seguido de cerca por BERT y Red Neuronal Convolucional, aunque los algoritmos tradicionales de aprendizaje automático también pueden proporcionar buenos resultados. Este trabajo también podría ayudar en la selección de algoritmos en la identificación de síntomas de enfermedades en el contenido de redes sociales.