Detección de spam chino utilizando una red híbrida BiGRU-CNN con incrustación textual y fonética conjunta

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Detección de spam chino utilizando una red híbrida BiGRU-CNN con incrustación textual y fonética conjunta

Autores: Yao, Jinliang; Wang, Chenrui; Hu, Chuang; Huang, Xiaoxi

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Detección de spam chino utilizando una red híbrida BiGRU-CNN con incrustación textual y fonética conjunta

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Proliferación

Spam

China

Usuarios de internet

Aprendizaje automático

Spam adversario

Sistemas de detección

Sustitución homofónica china

Spammers

Estrategias

Identificación de spam

Unidad Recurrente Bidireccional con Compuertas

Red Neuronal Convolucional de Texto

Modelo híbrido

Incrustación conjunta

Información fonética

Compartición de parámetros

Memoria a largo plazo

Resultados experimentales

Conjuntos de datos del mundo real

Ruido de homófonos

Modelos de aprendizaje profundo

Generalidad

Incrustación textual

Incrustación fonética.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 27

Citaciones: Sin citaciones

La proliferación de spam en China tiene un impacto negativo en la experiencia de los usuarios de Internet en línea. Los métodos existentes para detectar spam se basan principalmente en el aprendizaje automático. Sin embargo, se ha descubierto que estos métodos son susceptibles al spam textual adversarial que ha sido modificado frecuentemente de manera imperceptible por los spammers. Los spammers continúan modificando sus estrategias para evadir los sistemas de detección de spam. El texto con sustitución homofónica en chino puede ser fácilmente comprendido por los usuarios según su contexto. Actualmente, los spammers utilizan ampliamente la sustitución homofónica para evadir los sistemas de identificación de spam en Internet. Para abordar estos problemas, proponemos un modelo híbrido de Red Recurrente Bidireccional con Compuerta (BiGRU) y Red Neuronal Convolucional de Texto (TextCNN) con incrustación conjunta para detectar spam en chino. Nuestro modelo utiliza eficazmente la información fonética y combina las ventajas del intercambio de parámetros de TextCNN con la memoria a largo plazo de BiGRU. Los resultados experimentales en conjuntos de datos del mundo real muestran que nuestro modelo resiste en cierta medida el ruido homofónico y supera a los modelos de aprendizaje profundo convencionales. También demostramos la generalidad de la incrustación textual y fonética conjunta, que es aplicable a otras redes de aprendizaje profundo en tareas de detección de spam en chino.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro