Bstc: un modelo de detección de reseñas falsas basado en un modelo de lenguaje pre-entrenado y una red neuronal convolucional
Autores: Lu, Junwen; Zhan, Xintao; Liu, Guanfeng; Zhan, Xinrong; Deng, Xiaolong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Bstc: un modelo de detección de reseñas falsas basado en un modelo de lenguaje pre-entrenado y una red neuronal convolucional
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detectar revisiones falsas
Modelos de lenguaje pre-entrenados
Tareas de procesamiento de lenguaje natural
Conocimiento de sentimientos
Modelo BSTC
Detección de revisiones falsas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Detectar reseñas falsas puede ayudar a los clientes a tomar mejores decisiones de compra y mantener un entorno comercial en línea positivo. En los últimos años, los modelos de lenguaje pre-entrenados han mejorado significativamente el rendimiento de las tareas de procesamiento del lenguaje natural. Estos modelos pueden generar diferentes vectores de representación para cada palabra en diferentes contextos, resolviendo así el desafío de los múltiples significados de una palabra, que los métodos tradicionales de vector de palabras como Word2Vec no pueden resolver, y, por lo tanto, capturan mejor la información contextual del texto. Además, consideramos que las reseñas generalmente contienen ricas expresiones de opinión y sentimiento, mientras que la mayoría de los modelos de lenguaje pre-entrenados, incluido BERT, carecen de la consideración del conocimiento de sentimiento en la etapa de pre-entrenamiento. Basándonos en las consideraciones anteriores, proponemos un nuevo modelo de detección de reseñas falsas basado en un modelo de lenguaje pre-entrenado y una red neuronal convolucional, que se llama BSTC. BSTC considera BERT, SKEP y TextCNN, donde SKEP es un modelo de lenguaje pre-entrenado basado en el enriquecimiento del conocimiento de sentimiento. Realizamos una serie de experimentos en tres conjuntos de datos de referencia, y los hallazgos ilustran que BSTC supera a los métodos de vanguardia en la detección de reseñas falsas. Logró la mayor precisión en los tres conjuntos de datos de referencia: Hotel, Restaurante y Doctor, con 93.44%, 91.25% y 92.86%, respectivamente.
Descripción
Detectar reseñas falsas puede ayudar a los clientes a tomar mejores decisiones de compra y mantener un entorno comercial en línea positivo. En los últimos años, los modelos de lenguaje pre-entrenados han mejorado significativamente el rendimiento de las tareas de procesamiento del lenguaje natural. Estos modelos pueden generar diferentes vectores de representación para cada palabra en diferentes contextos, resolviendo así el desafío de los múltiples significados de una palabra, que los métodos tradicionales de vector de palabras como Word2Vec no pueden resolver, y, por lo tanto, capturan mejor la información contextual del texto. Además, consideramos que las reseñas generalmente contienen ricas expresiones de opinión y sentimiento, mientras que la mayoría de los modelos de lenguaje pre-entrenados, incluido BERT, carecen de la consideración del conocimiento de sentimiento en la etapa de pre-entrenamiento. Basándonos en las consideraciones anteriores, proponemos un nuevo modelo de detección de reseñas falsas basado en un modelo de lenguaje pre-entrenado y una red neuronal convolucional, que se llama BSTC. BSTC considera BERT, SKEP y TextCNN, donde SKEP es un modelo de lenguaje pre-entrenado basado en el enriquecimiento del conocimiento de sentimiento. Realizamos una serie de experimentos en tres conjuntos de datos de referencia, y los hallazgos ilustran que BSTC supera a los métodos de vanguardia en la detección de reseñas falsas. Logró la mayor precisión en los tres conjuntos de datos de referencia: Hotel, Restaurante y Doctor, con 93.44%, 91.25% y 92.86%, respectivamente.