Una encuesta sobre el análisis de sentimientos y la minería de opiniones en las redes sociales griegas
Autores: Alexandridis, Georgios; Varlamis, Iraklis; Korovesis, Konstantinos; Caridakis, George; Tsantilas, Panagiotis
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Una encuesta sobre el análisis de sentimientos y la minería de opiniones en las redes sociales griegas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Contenido
Análisis de sentimientos
Minería de opiniones
Algoritmos de minería de texto
Técnicas de aprendizaje profundo
Modelos de lenguaje
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
A medida que la cantidad de contenido que se crea en las redes sociales sigue aumentando, cada vez más opiniones y sentimientos son expresados por las personas sobre diversos temas. En este sentido, las técnicas de análisis de sentimientos y minería de opiniones pueden ser valiosas para el análisis automático de grandes corpus textuales (comentarios, reseñas, tweets, etc.). A pesar de los avances en algoritmos de minería de texto, técnicas de aprendizaje profundo y modelos de representación de texto, los resultados en tales tareas son muy buenos solo para unos pocos idiomas de alta densidad (por ejemplo, el inglés) que poseen grandes corpus de entrenamiento y ricos recursos lingüísticos; sin embargo, aún hay margen de mejora para los otros idiomas de menor densidad. En esta dirección, el trabajo actual emplea varios modelos de lenguaje para representar textos de redes sociales y clasificadores de texto en griego, para detectar la polaridad de las opiniones expresadas en las redes sociales. Los resultados experimentales en un conjunto de datos relacionado recopilado por los autores del trabajo actual son prometedores, ya que varios clasificadores basados en los modelos de lenguaje (bayesiano ingenuo, bosques aleatorios, máquinas de soporte vectorial, regresión logística, redes neuronales profundas de avance) superan a los de incrustaciones basadas en palabras o frases (word2vec, GloVe), logrando una precisión de clasificación de más del 80%. Además, también se ha entrenado un nuevo modelo de lenguaje para las redes sociales en griego en el conjunto de datos mencionado, demostrando que los modelos de lenguaje basados en corpus específicos de dominio pueden mejorar el rendimiento de los modelos de lenguaje genéricos en un margen del 2%. Finalmente, los modelos resultantes se ponen a disposición de forma gratuita para la comunidad de investigación.
Descripción
A medida que la cantidad de contenido que se crea en las redes sociales sigue aumentando, cada vez más opiniones y sentimientos son expresados por las personas sobre diversos temas. En este sentido, las técnicas de análisis de sentimientos y minería de opiniones pueden ser valiosas para el análisis automático de grandes corpus textuales (comentarios, reseñas, tweets, etc.). A pesar de los avances en algoritmos de minería de texto, técnicas de aprendizaje profundo y modelos de representación de texto, los resultados en tales tareas son muy buenos solo para unos pocos idiomas de alta densidad (por ejemplo, el inglés) que poseen grandes corpus de entrenamiento y ricos recursos lingüísticos; sin embargo, aún hay margen de mejora para los otros idiomas de menor densidad. En esta dirección, el trabajo actual emplea varios modelos de lenguaje para representar textos de redes sociales y clasificadores de texto en griego, para detectar la polaridad de las opiniones expresadas en las redes sociales. Los resultados experimentales en un conjunto de datos relacionado recopilado por los autores del trabajo actual son prometedores, ya que varios clasificadores basados en los modelos de lenguaje (bayesiano ingenuo, bosques aleatorios, máquinas de soporte vectorial, regresión logística, redes neuronales profundas de avance) superan a los de incrustaciones basadas en palabras o frases (word2vec, GloVe), logrando una precisión de clasificación de más del 80%. Además, también se ha entrenado un nuevo modelo de lenguaje para las redes sociales en griego en el conjunto de datos mencionado, demostrando que los modelos de lenguaje basados en corpus específicos de dominio pueden mejorar el rendimiento de los modelos de lenguaje genéricos en un margen del 2%. Finalmente, los modelos resultantes se ponen a disposición de forma gratuita para la comunidad de investigación.