Un estudio sobre la identificación del ejército de agua para mejorar la utilidad de las reseñas de productos en línea
Autores: Li, Chuyang; Zhang, Shijia; Liu, Xiangdong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un estudio sobre la identificación del ejército de agua para mejorar la utilidad de las reseñas de productos en línea
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Perspectiva
Aprendizaje automático
Visualización de datos
Reseñas de productos en línea
Ejército de agua
Modelo TF-IDF
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Basándose en la perspectiva de identificar el ejército de agua, este documento utiliza los métodos de aprendizaje automático y visualización de datos para analizar la utilidad de las reseñas de productos en línea, retratar los perfiles de productos y proporcionar reseñas de productos reales y útiles. Para identificar y eliminar el ejército de agua, se utilizan el Modelo de Frecuencia de Término-Inverso de Frecuencia de Documento (TF-IDF) y el Modelo de Índice Semántico Latente (LSI). Después de eliminar el ejército de agua, se seleccionaron tres métodos de clasificación para realizar análisis sentimental, incluyendo logística, SnowNLP y Red Neuronal Convolucional para texto (TextCNN). El TextCNN tiene la puntuación F1 más alta entre los tres métodos de clasificación. Al mismo tiempo, se utiliza el modo de Asignación Latente de Dirichlet (LDA) para extraer los temas de diversas reseñas. Finalmente, se proponen medidas correctivas dirigidas a fabricantes, consumidores y reguladores.
Descripción
Basándose en la perspectiva de identificar el ejército de agua, este documento utiliza los métodos de aprendizaje automático y visualización de datos para analizar la utilidad de las reseñas de productos en línea, retratar los perfiles de productos y proporcionar reseñas de productos reales y útiles. Para identificar y eliminar el ejército de agua, se utilizan el Modelo de Frecuencia de Término-Inverso de Frecuencia de Documento (TF-IDF) y el Modelo de Índice Semántico Latente (LSI). Después de eliminar el ejército de agua, se seleccionaron tres métodos de clasificación para realizar análisis sentimental, incluyendo logística, SnowNLP y Red Neuronal Convolucional para texto (TextCNN). El TextCNN tiene la puntuación F1 más alta entre los tres métodos de clasificación. Al mismo tiempo, se utiliza el modo de Asignación Latente de Dirichlet (LDA) para extraer los temas de diversas reseñas. Finalmente, se proponen medidas correctivas dirigidas a fabricantes, consumidores y reguladores.