¿pueden los modelos de detección de noticias falsas mantener el rendimiento a lo largo del tiempo? una evaluación longitudinal de publicaciones en twitter
Autores: Guimarães, Nuno; Figueira, Álvaro; Torgo, Luís
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
¿pueden los modelos de detección de noticias falsas mantener el rendimiento a lo largo del tiempo? una evaluación longitudinal de publicaciones en twitter
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Información falsa
Redes sociales
Detección de noticias falsas
Escenario a largo plazo
Características de incrustación de palabras
Períodos de datos de entrenamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 52
Citaciones: Sin citaciones
El impacto negativo de la información falsa en las redes sociales está creciendo rápidamente. La investigación actual sobre el tema se centra en la detección de noticias falsas en un contexto o evento particular (como elecciones) o utilizando datos de un período corto de tiempo. Por lo tanto, falta una evaluación de las propuestas actuales en un escenario a largo plazo donde los temas discutidos pueden cambiar. En este trabajo, nos desviamos de los enfoques actuales del problema y en cambio nos enfocamos en una evaluación longitudinal utilizando publicaciones en redes sociales que abarcan un período de 18 meses. Evaluamos diferentes combinaciones de características y modelos supervisados en un escenario a largo plazo donde los datos de entrenamiento y prueba están ordenados cronológicamente, y así la robustez y estabilidad de los modelos pueden ser evaluadas a lo largo del tiempo. Experimentamos con 3 escenarios diferentes donde los modelos se entrenan con períodos de datos de 15, 30 y 60 días. Los resultados muestran que los modelos de detección entrenados con características de incrustación de palabras son los que tienen un mejor rendimiento y son menos propensos a ser afectados por el cambio de temas (por ejemplo, el surgimiento de teorías de conspiración sobre COVID-19). Además, los días adicionales de datos de entrenamiento también aumentan el rendimiento de las mejores combinaciones de características/modelo, aunque no de manera muy significativa (alrededor del 2%). Los resultados presentados en este documento sientan las bases para un enfoque más pragmático hacia la evaluación de modelos de detección de noticias falsas en redes sociales.
Descripción
El impacto negativo de la información falsa en las redes sociales está creciendo rápidamente. La investigación actual sobre el tema se centra en la detección de noticias falsas en un contexto o evento particular (como elecciones) o utilizando datos de un período corto de tiempo. Por lo tanto, falta una evaluación de las propuestas actuales en un escenario a largo plazo donde los temas discutidos pueden cambiar. En este trabajo, nos desviamos de los enfoques actuales del problema y en cambio nos enfocamos en una evaluación longitudinal utilizando publicaciones en redes sociales que abarcan un período de 18 meses. Evaluamos diferentes combinaciones de características y modelos supervisados en un escenario a largo plazo donde los datos de entrenamiento y prueba están ordenados cronológicamente, y así la robustez y estabilidad de los modelos pueden ser evaluadas a lo largo del tiempo. Experimentamos con 3 escenarios diferentes donde los modelos se entrenan con períodos de datos de 15, 30 y 60 días. Los resultados muestran que los modelos de detección entrenados con características de incrustación de palabras son los que tienen un mejor rendimiento y son menos propensos a ser afectados por el cambio de temas (por ejemplo, el surgimiento de teorías de conspiración sobre COVID-19). Además, los días adicionales de datos de entrenamiento también aumentan el rendimiento de las mejores combinaciones de características/modelo, aunque no de manera muy significativa (alrededor del 2%). Los resultados presentados en este documento sientan las bases para un enfoque más pragmático hacia la evaluación de modelos de detección de noticias falsas en redes sociales.