Ilusión de verdad: analizando y clasificando noticias falsas sobre COVID-19 en idioma portugués brasileño
Autores: Endo, Patricia Takako; Santos, Guto Leoni; de Lima Xavier, Maria Eduarda; Nascimento Campos, Gleyson Rhuan; de Lima, Luciana Conceição; Silva, Ivanovitch; Egli, Antonia; Lynn, Theo
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Ilusión de verdad: analizando y clasificando noticias falsas sobre COVID-19 en idioma portugués brasileño
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Intervenciones de salud pública
Adopción digital
Información falsa
Pandemia de COVID-19
Aprendizaje automático
Portugués brasileño
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 50
Citaciones: Sin citaciones
Las intervenciones de salud pública para contrarrestar la pandemia de COVID-19 han acelerado e incrementado la adopción digital y el uso de Internet para obtener información de salud. Lamentablemente, hay evidencia que sugiere que también ha acelerado e incrementado la propagación de información falsa relacionada con el COVID-19. Las consecuencias de la desinformación, la información errónea y la interpretación incorrecta de la información de salud pueden interferir con los intentos de frenar el virus, retrasar o resultar en la falta de búsqueda o continuación de tratamiento médico legítimo y adherencia a la vacunación, así como interferir con políticas de salud pública sólidas y los intentos de difundir mensajes de salud pública. Aunque existe una cantidad significativa de literatura, conjuntos de datos y herramientas para apoyar contramedidas contra la propagación de información falsa en línea en idiomas ricos en recursos como el inglés y el chino, hay pocos recursos de este tipo para apoyar el portugués, y específicamente el portugués brasileño. En este estudio, exploramos el uso de técnicas de aprendizaje automático y aprendizaje profundo para identificar noticias falsas en comunicaciones en línea en el idioma portugués brasileño relacionadas con la pandemia de COVID-19. Construimos un conjunto de datos de 11,382 elementos que comprenden datos desde enero de 2020 hasta febrero de 2021. El análisis exploratorio de datos sugiere que las noticias falsas sobre la vacuna COVID-19 eran prevalentes en Brasil, muchas de ellas relacionadas con comunicaciones gubernamentales. Para mitigar el impacto adverso de las noticias falsas, analizamos el impacto del aprendizaje automático para detectar noticias falsas basadas en palabras clave en las comunicaciones. Los resultados sugieren que las palabras clave mejoran el rendimiento de los modelos al mantenerlas dentro del mensaje. Random Forest fue el modelo de aprendizaje automático con los mejores resultados, logrando un 97.91% de precisión, mientras que Bi-GRU fue el mejor modelo de aprendizaje profundo con un puntaje F1 de 94.03%.
Descripción
Las intervenciones de salud pública para contrarrestar la pandemia de COVID-19 han acelerado e incrementado la adopción digital y el uso de Internet para obtener información de salud. Lamentablemente, hay evidencia que sugiere que también ha acelerado e incrementado la propagación de información falsa relacionada con el COVID-19. Las consecuencias de la desinformación, la información errónea y la interpretación incorrecta de la información de salud pueden interferir con los intentos de frenar el virus, retrasar o resultar en la falta de búsqueda o continuación de tratamiento médico legítimo y adherencia a la vacunación, así como interferir con políticas de salud pública sólidas y los intentos de difundir mensajes de salud pública. Aunque existe una cantidad significativa de literatura, conjuntos de datos y herramientas para apoyar contramedidas contra la propagación de información falsa en línea en idiomas ricos en recursos como el inglés y el chino, hay pocos recursos de este tipo para apoyar el portugués, y específicamente el portugués brasileño. En este estudio, exploramos el uso de técnicas de aprendizaje automático y aprendizaje profundo para identificar noticias falsas en comunicaciones en línea en el idioma portugués brasileño relacionadas con la pandemia de COVID-19. Construimos un conjunto de datos de 11,382 elementos que comprenden datos desde enero de 2020 hasta febrero de 2021. El análisis exploratorio de datos sugiere que las noticias falsas sobre la vacuna COVID-19 eran prevalentes en Brasil, muchas de ellas relacionadas con comunicaciones gubernamentales. Para mitigar el impacto adverso de las noticias falsas, analizamos el impacto del aprendizaje automático para detectar noticias falsas basadas en palabras clave en las comunicaciones. Los resultados sugieren que las palabras clave mejoran el rendimiento de los modelos al mantenerlas dentro del mensaje. Random Forest fue el modelo de aprendizaje automático con los mejores resultados, logrando un 97.91% de precisión, mientras que Bi-GRU fue el mejor modelo de aprendizaje profundo con un puntaje F1 de 94.03%.