¿pueden los modelos de detección de noticias falsas mantener el rendimiento a lo largo del tiempo? una evaluación longitudinal de publicaciones en twitter

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

¿pueden los modelos de detección de noticias falsas mantener el rendimiento a lo largo del tiempo? una evaluación longitudinal de publicaciones en twitter

Autores: Guimarães, Nuno; Figueira, Álvaro; Torgo, Luís

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

¿pueden los modelos de detección de noticias falsas mantener el rendimiento a lo largo del tiempo? una evaluación longitudinal de publicaciones en twitter

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Información falsa

Redes sociales

Detección de noticias falsas

Escenario a largo plazo

Características de incrustación de palabras

Períodos de datos de entrenamiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 52

Citaciones: Sin citaciones

El impacto negativo de la información falsa en las redes sociales está creciendo rápidamente. La investigación actual sobre el tema se centra en la detección de noticias falsas en un contexto o evento particular (como elecciones) o utilizando datos de un período corto de tiempo. Por lo tanto, falta una evaluación de las propuestas actuales en un escenario a largo plazo donde los temas discutidos pueden cambiar. En este trabajo, nos desviamos de los enfoques actuales del problema y en cambio nos enfocamos en una evaluación longitudinal utilizando publicaciones en redes sociales que abarcan un período de 18 meses. Evaluamos diferentes combinaciones de características y modelos supervisados en un escenario a largo plazo donde los datos de entrenamiento y prueba están ordenados cronológicamente, y así la robustez y estabilidad de los modelos pueden ser evaluadas a lo largo del tiempo. Experimentamos con 3 escenarios diferentes donde los modelos se entrenan con períodos de datos de 15, 30 y 60 días. Los resultados muestran que los modelos de detección entrenados con características de incrustación de palabras son los que tienen un mejor rendimiento y son menos propensos a ser afectados por el cambio de temas (por ejemplo, el surgimiento de teorías de conspiración sobre COVID-19). Además, los días adicionales de datos de entrenamiento también aumentan el rendimiento de las mejores combinaciones de características/modelo, aunque no de manera muy significativa (alrededor del 2%). Los resultados presentados en este documento sientan las bases para un enfoque más pragmático hacia la evaluación de modelos de detección de noticias falsas en redes sociales.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro