Un enfoque de clasificación de sentimientos en tweets utilizando una técnica de ensamblaje apilado híbrido
Autores: Gaye, Babacar; Zhang, Dezheng; Wulamu, Aziguli
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un enfoque de clasificación de sentimientos en tweets utilizando una técnica de ensamblaje apilado híbrido
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Plataformas de redes sociales
Análisis de sentimientos
Tweets
Aprendizaje automático
Aprendizaje profundo
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Con la amplia disponibilidad de plataformas de redes sociales, Twitter se ha convertido en una herramienta significativa para la adquisición de las opiniones, actitudes y emociones de las personas hacia ciertas entidades. Dentro de este marco de referencia, el análisis de sentimientos de los tweets se ha convertido en una de las áreas de investigación más fascinantes en el campo del procesamiento del lenguaje natural. Se han ideado una variedad de técnicas para el análisis de sentimientos, pero aún hay margen de mejora en lo que respecta a la precisión y eficacia del sistema. Este estudio propone un enfoque novedoso que aprovecha las ventajas del diccionario léxico, el aprendizaje automático y los clasificadores de aprendizaje profundo. Clasificamos los tweets en función de los sentimientos extraídos por TextBlob utilizando un ensamblaje apilado de tres memorias a largo y corto plazo (LSTM) como clasificadores base y regresión logística (LR) como clasificador meta. El modelo propuesto demostró ser efectivo y ahorrar tiempo, ya que no requiere extracción de características, ya que LSTM extrae características sin intervención humana. También comparamos nuestro enfoque propuesto con modelos convencionales de aprendizaje automático como la regresión logística, AdaBoost y bosques aleatorios. También incluimos modelos de aprendizaje profundo de última generación en comparación con el modelo propuesto. Se realizaron experimentos en el conjunto de datos sentiment140 y se evaluaron en términos de precisión, exactitud, recuperación y puntuación F1. Los resultados empíricos mostraron que nuestro enfoque propuesto manifestó resultados de última generación al lograr una puntuación de precisión del 99%.
Descripción
Con la amplia disponibilidad de plataformas de redes sociales, Twitter se ha convertido en una herramienta significativa para la adquisición de las opiniones, actitudes y emociones de las personas hacia ciertas entidades. Dentro de este marco de referencia, el análisis de sentimientos de los tweets se ha convertido en una de las áreas de investigación más fascinantes en el campo del procesamiento del lenguaje natural. Se han ideado una variedad de técnicas para el análisis de sentimientos, pero aún hay margen de mejora en lo que respecta a la precisión y eficacia del sistema. Este estudio propone un enfoque novedoso que aprovecha las ventajas del diccionario léxico, el aprendizaje automático y los clasificadores de aprendizaje profundo. Clasificamos los tweets en función de los sentimientos extraídos por TextBlob utilizando un ensamblaje apilado de tres memorias a largo y corto plazo (LSTM) como clasificadores base y regresión logística (LR) como clasificador meta. El modelo propuesto demostró ser efectivo y ahorrar tiempo, ya que no requiere extracción de características, ya que LSTM extrae características sin intervención humana. También comparamos nuestro enfoque propuesto con modelos convencionales de aprendizaje automático como la regresión logística, AdaBoost y bosques aleatorios. También incluimos modelos de aprendizaje profundo de última generación en comparación con el modelo propuesto. Se realizaron experimentos en el conjunto de datos sentiment140 y se evaluaron en términos de precisión, exactitud, recuperación y puntuación F1. Los resultados empíricos mostraron que nuestro enfoque propuesto manifestó resultados de última generación al lograr una puntuación de precisión del 99%.