Interacción multimodal y red de convolución de gráficos fusionados para la clasificación de sentimientos de reseñas en línea
Autores: Zeng, Dehong; Chen, Xiaosong; Song, Zhengxin; Xue, Yun; Cai, Qianhua
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Interacción multimodal y red de convolución de gráficos fusionados para la clasificación de sentimientos de reseñas en línea
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Personas
Opiniones
Datos multimodales
Clasificación de sentimientos
Red convolucional de grafos
Conjunto de datos multimodal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Un número creciente de personas tiende a expresar sus opiniones en diferentes modalidades. Con el propósito de la minería de opiniones, la clasificación de sentimientos basada en datos multimodales se convierte en un enfoque principal. En este trabajo, proponemos un enfoque novedoso para tratar tanto textos como imágenes en la tarea de análisis de sentimientos multimodales a nivel de documento. La leyenda de la imagen se introduce como un auxiliar, que se alinea con la imagen para mejorar la entrega de la semántica. Luego, se construye un grafo con las oraciones e imágenes generadas como nodos. En línea con el aprendizaje del grafo, se pueden capturar las dependencias a larga distancia mientras se filtra el ruido visual. Específicamente, se construye una red convolucional de grafos multimodales para la fusión de información multimodal. Se realizan experimentos extensos en un conjunto de datos multimodal de Yelp. Los resultados experimentales revelan que nuestro modelo obtiene un rendimiento satisfactorio en tareas de DLMSA.
Descripción
Un número creciente de personas tiende a expresar sus opiniones en diferentes modalidades. Con el propósito de la minería de opiniones, la clasificación de sentimientos basada en datos multimodales se convierte en un enfoque principal. En este trabajo, proponemos un enfoque novedoso para tratar tanto textos como imágenes en la tarea de análisis de sentimientos multimodales a nivel de documento. La leyenda de la imagen se introduce como un auxiliar, que se alinea con la imagen para mejorar la entrega de la semántica. Luego, se construye un grafo con las oraciones e imágenes generadas como nodos. En línea con el aprendizaje del grafo, se pueden capturar las dependencias a larga distancia mientras se filtra el ruido visual. Específicamente, se construye una red convolucional de grafos multimodales para la fusión de información multimodal. Se realizan experimentos extensos en un conjunto de datos multimodal de Yelp. Los resultados experimentales revelan que nuestro modelo obtiene un rendimiento satisfactorio en tareas de DLMSA.