Análisis de sentimiento a nivel de documento utilizando una red neuronal de memoria a largo plazo bidireccional con atención y una red neuronal convolucional bidimensional
Autores: Mao, Yanying; Zhang, Yu; Jiao, Liudan; Zhang, Heshan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Análisis de sentimiento a nivel de documento utilizando una red neuronal de memoria a largo plazo bidireccional con atención y una red neuronal convolucional bidimensional
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales
Análisis de sentimientos
Textos largos
Características del documento
AttBiLSTM-2DCNN
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Debido a la destacada capacidad de extracción de características, las redes neuronales han logrado recientemente un gran éxito en el análisis de sentimientos. Sin embargo, uno de los desafíos restantes del análisis de sentimientos es modelar textos largos para considerar las relaciones intrínsecas entre dos oraciones en el significado semántico de un documento. Además, la mayoría de los métodos existentes no son lo suficientemente potentes para diferenciar la importancia de diferentes características del documento. Para abordar estos problemas, este documento propone un nuevo modelo de red neuronal: AttBiLSTM-2DCNN, que implica dos perspectivas. Primero, se utiliza una red de memoria a corto y largo plazo bidireccional de dos capas (BiLSTM) para obtener la semántica de sentimiento de un documento. La primera capa de BiLSTM aprende la representación semántica de sentimiento desde ambas direcciones de una oración, y la segunda capa de BiLSTM se utiliza para codificar las relaciones intrínsecas de las oraciones en la representación matricial del documento con una dimensión de característica y una dimensión de paso de tiempo. En segundo lugar, se emplea una red neuronal convolucional bidimensional (2DCNN) para obtener más dependencias de sentimiento entre dos oraciones. En tercer lugar, utilizamos un mecanismo de atención de dos capas para distinguir la importancia de las palabras y oraciones en el documento. Por último, para validar el modelo, realizamos un experimento en dos conjuntos de datos públicos de reseñas derivados de Yelp2015 e IMDB. La precisión, la medida F1 y el MSE se utilizan como métricas de evaluación. Los resultados experimentales muestran que nuestro modelo no solo puede capturar relaciones sentimentales, sino que también supera a ciertos modelos de vanguardia.
Descripción
Debido a la destacada capacidad de extracción de características, las redes neuronales han logrado recientemente un gran éxito en el análisis de sentimientos. Sin embargo, uno de los desafíos restantes del análisis de sentimientos es modelar textos largos para considerar las relaciones intrínsecas entre dos oraciones en el significado semántico de un documento. Además, la mayoría de los métodos existentes no son lo suficientemente potentes para diferenciar la importancia de diferentes características del documento. Para abordar estos problemas, este documento propone un nuevo modelo de red neuronal: AttBiLSTM-2DCNN, que implica dos perspectivas. Primero, se utiliza una red de memoria a corto y largo plazo bidireccional de dos capas (BiLSTM) para obtener la semántica de sentimiento de un documento. La primera capa de BiLSTM aprende la representación semántica de sentimiento desde ambas direcciones de una oración, y la segunda capa de BiLSTM se utiliza para codificar las relaciones intrínsecas de las oraciones en la representación matricial del documento con una dimensión de característica y una dimensión de paso de tiempo. En segundo lugar, se emplea una red neuronal convolucional bidimensional (2DCNN) para obtener más dependencias de sentimiento entre dos oraciones. En tercer lugar, utilizamos un mecanismo de atención de dos capas para distinguir la importancia de las palabras y oraciones en el documento. Por último, para validar el modelo, realizamos un experimento en dos conjuntos de datos públicos de reseñas derivados de Yelp2015 e IMDB. La precisión, la medida F1 y el MSE se utilizan como métricas de evaluación. Los resultados experimentales muestran que nuestro modelo no solo puede capturar relaciones sentimentales, sino que también supera a ciertos modelos de vanguardia.