Extracción de Tweets sobre síntomas de COVID-19 autoinformados y matrices de movilidad de origen/destino de Twitter para informar modelos de enfermedades
Autores: Rosato, Conor; Moore, Robert E.; Carter, Matthew; Heap, John; Harris, John; Storopoli, Jose; Maskell, Simon
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Extracción de Tweets sobre síntomas de COVID-19 autoinformados y matrices de movilidad de origen/destino de Twitter para informar modelos de enfermedades
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Nuevo coronavirus
COVID-19
Twitter
Individuos sintomáticos
Modelo epidemiológico SEIRD
Predicciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La aparición del nuevo coronavirus (COVID-19) generó la necesidad de reunir de manera rápida y precisa información actualizada relacionada con su propagación. En este artículo de investigación, proponemos dos métodos en los que Twitter es útil al modelar la propagación de COVID-19: (1) se utilizan algoritmos de aprendizaje automático entrenados en inglés, español, alemán, portugués e italiano para identificar individuos sintomáticos derivados de Twitter. Usando la geolocalización adjunta a cada tweet, mapeamos a los usuarios a una ubicación geográfica para producir una serie temporal de posibles individuos sintomáticos. Calibramos un modelo epidemiológico SEIRD extendido con combinaciones de flujos de datos de baja latencia, incluidos los tweets sintomáticos, con datos de muertes e inferimos los parámetros del modelo. Luego evaluamos la utilidad de los flujos de datos al hacer predicciones de muertes diarias en 50 estados de EE. UU., 16 países de América Latina, 2 países europeos y 7 regiones del NHS (Servicio Nacional de Salud) en el Reino Unido. Mostramos que el uso de tweets sintomáticos puede resultar en un aumento del 6% y 17% en la precisión del error cuadrático medio, en promedio, al predecir muertes por COVID-19 en los estados de EE. UU. y el resto del mundo, respectivamente, en comparación con el uso únicamente de datos de muertes. (2) Se construyen matrices de origen/destino (O/D) para los movimientos entre siete regiones del NHS, determinando cuándo un usuario ha tuiteado dos veces en un período de 24 horas en dos ubicaciones diferentes. Mostramos que aumentar y disminuir un parámetro de conectividad social dentro de un modelo SIR afecta la tasa de propagación de una enfermedad.
Descripción
La aparición del nuevo coronavirus (COVID-19) generó la necesidad de reunir de manera rápida y precisa información actualizada relacionada con su propagación. En este artículo de investigación, proponemos dos métodos en los que Twitter es útil al modelar la propagación de COVID-19: (1) se utilizan algoritmos de aprendizaje automático entrenados en inglés, español, alemán, portugués e italiano para identificar individuos sintomáticos derivados de Twitter. Usando la geolocalización adjunta a cada tweet, mapeamos a los usuarios a una ubicación geográfica para producir una serie temporal de posibles individuos sintomáticos. Calibramos un modelo epidemiológico SEIRD extendido con combinaciones de flujos de datos de baja latencia, incluidos los tweets sintomáticos, con datos de muertes e inferimos los parámetros del modelo. Luego evaluamos la utilidad de los flujos de datos al hacer predicciones de muertes diarias en 50 estados de EE. UU., 16 países de América Latina, 2 países europeos y 7 regiones del NHS (Servicio Nacional de Salud) en el Reino Unido. Mostramos que el uso de tweets sintomáticos puede resultar en un aumento del 6% y 17% en la precisión del error cuadrático medio, en promedio, al predecir muertes por COVID-19 en los estados de EE. UU. y el resto del mundo, respectivamente, en comparación con el uso únicamente de datos de muertes. (2) Se construyen matrices de origen/destino (O/D) para los movimientos entre siete regiones del NHS, determinando cuándo un usuario ha tuiteado dos veces en un período de 24 horas en dos ubicaciones diferentes. Mostramos que aumentar y disminuir un parámetro de conectividad social dentro de un modelo SIR afecta la tasa de propagación de una enfermedad.