logo móvil
Contáctanos

Detección de spam chino utilizando una red híbrida BiGRU-CNN con incrustación textual y fonética conjunta

Autores: Yao, Jinliang; Wang, Chenrui; Hu, Chuang; Huang, Xiaoxi

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Detección de spam chino utilizando una red híbrida BiGRU-CNN con incrustación textual y fonética conjunta


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Proliferación
Spam
China
Usuarios de internet
Aprendizaje automático
Spam adversario
Sistemas de detección
Sustitución homofónica china
Spammers
Estrategias
Identificación de spam
Unidad Recurrente Bidireccional con Compuertas
Red Neuronal Convolucional de Texto
Modelo híbrido
Incrustación conjunta
Información fonética
Compartición de parámetros
Memoria a largo plazo
Resultados experimentales
Conjuntos de datos del mundo real
Ruido de homófonos
Modelos de aprendizaje profundo
Generalidad
Incrustación textual
Incrustación fonética.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 27

Citaciones: Sin citaciones


Descripción
La proliferación de spam en China tiene un impacto negativo en la experiencia de los usuarios de Internet en línea. Los métodos existentes para detectar spam se basan principalmente en el aprendizaje automático. Sin embargo, se ha descubierto que estos métodos son susceptibles al spam textual adversarial que ha sido modificado frecuentemente de manera imperceptible por los spammers. Los spammers continúan modificando sus estrategias para evadir los sistemas de detección de spam. El texto con sustitución homofónica en chino puede ser fácilmente comprendido por los usuarios según su contexto. Actualmente, los spammers utilizan ampliamente la sustitución homofónica para evadir los sistemas de identificación de spam en Internet. Para abordar estos problemas, proponemos un modelo híbrido de Red Recurrente Bidireccional con Compuerta (BiGRU) y Red Neuronal Convolucional de Texto (TextCNN) con incrustación conjunta para detectar spam en chino. Nuestro modelo utiliza eficazmente la información fonética y combina las ventajas del intercambio de parámetros de TextCNN con la memoria a largo plazo de BiGRU. Los resultados experimentales en conjuntos de datos del mundo real muestran que nuestro modelo resiste en cierta medida el ruido homofónico y supera a los modelos de aprendizaje profundo convencionales. También demostramos la generalidad de la incrustación textual y fonética conjunta, que es aplicable a otras redes de aprendizaje profundo en tareas de detección de spam en chino.

Otros recursos que podrían interesarte

Temas Virtualpro