Mejora de la detección de spam social a través de mecanismos de atención en Twitter
Autores: Shen, Hua; Liu, Xinyue; Zhang, Xianchao
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Mejora de la detección de spam social a través de mecanismos de atención en Twitter
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Twitter
Spammers
Deep learning model
Attention-based mechanism
Bertweet
Social interactions
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Twitter es una de las plataformas de redes sociales más grandes, que permite a los usuarios hacer amigos, leer las últimas noticias, compartir ideas personales y discutir problemas sociales. La enorme popularidad de Twitter significa que atrae a muchos spammers en línea. Los enfoques tradicionales de detección de spam han demostrado ser efectivos para identificar spammers en Twitter mediante la extracción de características hechas a mano y el entrenamiento de modelos de aprendizaje automático. Sin embargo, dichos modelos necesitan conocimientos de expertos en el dominio. Además, los comportamientos de los spammers pueden cambiar según las estrategias de defensa de Twitter. Esto resulta en la ineficacia de los enfoques tradicionales basados en características. Aunque se han propuesto enfoques basados en aprendizaje profundo para detectar spammers en Twitter, todos tratan cada tweet por igual e ignoran las diferencias entre ellos. Para resolver estos problemas, en este artículo proponemos un nuevo modelo de aprendizaje profundo basado en atención para detectar spammers sociales en Twitter. En particular, primero presentamos el modelo de preentrenamiento de última generación BERTweet para aprender la representación de cada tweet, y luego utilizamos el mecanismo de atención propuesto para aprender las representaciones de usuario distinguiendo las diferencias entre los tweets publicados por cada usuario. Además, tenemos en cuenta las interacciones sociales y proponemos que se utilice una red de atención de gráficos para actualizar las representaciones de usuario aprendidas, para mejorar aún más la precisión en la identificación de spammers. Los experimentos en un conjunto de datos de Twitter del mundo real disponible públicamente muestran la efectividad del modelo propuesto, que es capaz de mejorar significativamente el rendimiento.
Descripción
Twitter es una de las plataformas de redes sociales más grandes, que permite a los usuarios hacer amigos, leer las últimas noticias, compartir ideas personales y discutir problemas sociales. La enorme popularidad de Twitter significa que atrae a muchos spammers en línea. Los enfoques tradicionales de detección de spam han demostrado ser efectivos para identificar spammers en Twitter mediante la extracción de características hechas a mano y el entrenamiento de modelos de aprendizaje automático. Sin embargo, dichos modelos necesitan conocimientos de expertos en el dominio. Además, los comportamientos de los spammers pueden cambiar según las estrategias de defensa de Twitter. Esto resulta en la ineficacia de los enfoques tradicionales basados en características. Aunque se han propuesto enfoques basados en aprendizaje profundo para detectar spammers en Twitter, todos tratan cada tweet por igual e ignoran las diferencias entre ellos. Para resolver estos problemas, en este artículo proponemos un nuevo modelo de aprendizaje profundo basado en atención para detectar spammers sociales en Twitter. En particular, primero presentamos el modelo de preentrenamiento de última generación BERTweet para aprender la representación de cada tweet, y luego utilizamos el mecanismo de atención propuesto para aprender las representaciones de usuario distinguiendo las diferencias entre los tweets publicados por cada usuario. Además, tenemos en cuenta las interacciones sociales y proponemos que se utilice una red de atención de gráficos para actualizar las representaciones de usuario aprendidas, para mejorar aún más la precisión en la identificación de spammers. Los experimentos en un conjunto de datos de Twitter del mundo real disponible públicamente muestran la efectividad del modelo propuesto, que es capaz de mejorar significativamente el rendimiento.