Un Modelo de Conjunto Basado en Estructura de Reseñas para Spam de Reseñas Engañosas
Autores: Zeng, Zhi-Yuan; Lin, Jyun-Jie; Chen, Mu-Sheng; Chen, Meng-Hui; Lan, Yan-Qi; Liu, Jun-Lin
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Un Modelo de Conjunto Basado en Estructura de Reseñas para Spam de Reseñas Engañosas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Consumidores
Comportamiento de compra
Reseñas en línea
Reseñas engañosas
Reseñas de spam
Modelos LSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El comportamiento de compra de los consumidores depende cada vez más de las reseñas en línea. En consecuencia, hay cada vez más reseñas engañosas que son perjudiciales para los clientes. Los métodos existentes para detectar reseñas de spam consideran principalmente el problema como una tarea general de clasificación de texto, pero ignoran las características importantes de las reseñas de spam. En este artículo, proponemos un modelo novedoso que divide una reseña en tres partes: la primera oración, el contexto medio y la última oración, basado en el descubrimiento de que la primera y la última oración expresan una emoción más fuerte que el contexto medio. Luego, el modelo utiliza cuatro modelos independientes de memoria a largo y corto plazo bidireccionales (LSTM) para codificar el principio, el medio, el final de una reseña y la reseña completa en cuatro representaciones documentales. Después de eso, las cuatro representaciones se integran en una representación documental mediante una capa de mecanismo de autoatención y una capa de mecanismo de atención. Basado en tres conjuntos de datos de dominio, los resultados de los experimentos en dominio y de dominio mixto muestran que nuestro método propuesto tiene un mejor rendimiento que los métodos comparados.
Descripción
El comportamiento de compra de los consumidores depende cada vez más de las reseñas en línea. En consecuencia, hay cada vez más reseñas engañosas que son perjudiciales para los clientes. Los métodos existentes para detectar reseñas de spam consideran principalmente el problema como una tarea general de clasificación de texto, pero ignoran las características importantes de las reseñas de spam. En este artículo, proponemos un modelo novedoso que divide una reseña en tres partes: la primera oración, el contexto medio y la última oración, basado en el descubrimiento de que la primera y la última oración expresan una emoción más fuerte que el contexto medio. Luego, el modelo utiliza cuatro modelos independientes de memoria a largo y corto plazo bidireccionales (LSTM) para codificar el principio, el medio, el final de una reseña y la reseña completa en cuatro representaciones documentales. Después de eso, las cuatro representaciones se integran en una representación documental mediante una capa de mecanismo de autoatención y una capa de mecanismo de atención. Basado en tres conjuntos de datos de dominio, los resultados de los experimentos en dominio y de dominio mixto muestran que nuestro método propuesto tiene un mejor rendimiento que los métodos comparados.