Un método de fusión multi-representacional basado en atención para la clasificación de texto basada en redes sociales
Autores: Liu, Jing; Wang, Xiaoying; Tan, Yan; Huang, Lihua; Wang, Yue
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un método de fusión multi-representacional basado en atención para la clasificación de texto basada en redes sociales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Tareas de clasificación de texto
Redes sociales
Modelos de aprendizaje profundo
Ingeniería de características
Redes neuronales profundas
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Existen diversas tareas de clasificación de texto utilizando contenidos generados por usuarios (UGC) en las redes sociales en la era de los grandes datos. En vista de las ventajas y desventajas de los modelos de aprendizaje automático basados en ingeniería de características y los modelos de aprendizaje profundo, argumentamos que fusionar la representación de texto hecha a mano a través de la ingeniería de características y las representaciones de texto impulsadas por datos extraídas mediante métodos de aprendizaje profundo es beneficioso para mejorar la capacidad de clasificación de texto. Dadas las características de diferentes redes neuronales profundas, es necesario investigar su efecto complementario. Además, las contribuciones de estas representaciones deben ser aprendidas de manera adaptativa cuando se trata de abordar diferentes tareas o predecir diferentes muestras. Por lo tanto, en este artículo, proponemos una nueva arquitectura de red neuronal profunda fusionada con un mecanismo de atención jerárquico para la clasificación de texto con datos de redes sociales. Específicamente, en el contexto de que las características hechas a mano están disponibles, empleamos el mecanismo de atención para fusionar de manera adaptativa la representación de texto totalmente impulsada por datos y la representación hecha a mano. Para la generación de la representación de texto impulsada por datos, proponemos un codificador impulsado por datos que fusiona representaciones de texto derivadas de tres métodos de aprendizaje profundo con el mecanismo de atención, para seleccionar de manera adaptativa representaciones discriminativas y explorar su efecto complementario. Para verificar la efectividad de nuestro enfoque, realizamos dos tareas de clasificación de texto, es decir, identificar tweets relevantes sobre reacciones adversas a medicamentos (ADR) de las redes sociales e identificar reseñas relevantes comparativas de una plataforma de comercio electrónico. Los resultados experimentales demuestran que nuestro enfoque supera a otras líneas base.
Descripción
Existen diversas tareas de clasificación de texto utilizando contenidos generados por usuarios (UGC) en las redes sociales en la era de los grandes datos. En vista de las ventajas y desventajas de los modelos de aprendizaje automático basados en ingeniería de características y los modelos de aprendizaje profundo, argumentamos que fusionar la representación de texto hecha a mano a través de la ingeniería de características y las representaciones de texto impulsadas por datos extraídas mediante métodos de aprendizaje profundo es beneficioso para mejorar la capacidad de clasificación de texto. Dadas las características de diferentes redes neuronales profundas, es necesario investigar su efecto complementario. Además, las contribuciones de estas representaciones deben ser aprendidas de manera adaptativa cuando se trata de abordar diferentes tareas o predecir diferentes muestras. Por lo tanto, en este artículo, proponemos una nueva arquitectura de red neuronal profunda fusionada con un mecanismo de atención jerárquico para la clasificación de texto con datos de redes sociales. Específicamente, en el contexto de que las características hechas a mano están disponibles, empleamos el mecanismo de atención para fusionar de manera adaptativa la representación de texto totalmente impulsada por datos y la representación hecha a mano. Para la generación de la representación de texto impulsada por datos, proponemos un codificador impulsado por datos que fusiona representaciones de texto derivadas de tres métodos de aprendizaje profundo con el mecanismo de atención, para seleccionar de manera adaptativa representaciones discriminativas y explorar su efecto complementario. Para verificar la efectividad de nuestro enfoque, realizamos dos tareas de clasificación de texto, es decir, identificar tweets relevantes sobre reacciones adversas a medicamentos (ADR) de las redes sociales e identificar reseñas relevantes comparativas de una plataforma de comercio electrónico. Los resultados experimentales demuestran que nuestro enfoque supera a otras líneas base.