logo móvil
Contáctanos

Modelos de Análisis de Sentimiento de Aprendizaje Automático y Aprendizaje Profundo: Estudio de Caso sobre el Corpus SENT-COVID de Tweets en Español Mexicano

Autores: Gomez-Adorno, Helena; Bel-Enguix, Gemma; Sierra, Gerardo; Barajas, Juan-Carlos; Álvarez, William

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Modelos de Análisis de Sentimiento de Aprendizaje Automático y Aprendizaje Profundo: Estudio de Caso sobre el Corpus SENT-COVID de Tweets en Español Mexicano


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Aprendizaje automático tradicional
Modelos de aprendizaje profundo
Tendencias de sentimiento
COVID-19
Análisis de sentimiento
Algoritmos de clasificación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Este artículo presenta una evaluación integral de los modelos de aprendizaje automático tradicional y de aprendizaje profundo en el análisis de tendencias de sentimiento dentro del corpus de Twitter SENT-COVID, recopilado durante la pandemia de COVID-19. El corpus, filtrado por palabras clave relacionadas con COVID-19 y anotado manualmente para polaridad, es un recurso fundamental para llevar a cabo experimentos de análisis de sentimiento. Nuestro estudio investiga varios enfoques, incluidos sistemas clásicos basados en vectores como word2vec, doc2vec y diversas técnicas de modelado de frases, junto con modelos BERT preentrenados en español. Evaluamos el rendimiento de bibliotecas de análisis de sentimiento fácilmente disponibles para usuarios de Python, incluyendo TextBlob, VADER y Pysentimiento. Además, implementamos y evaluamos algoritmos de clasificación tradicionales como Regresión Logística, Naive Bayes, Máquinas de Vectores de Soporte y redes neuronales simples como el Perceptrón Multicapa. A lo largo de la investigación, exploramos diferentes técnicas de reducción de dimensionalidad. Esta metodología permite una comparación precisa entre los métodos de clasificación, con BETO-uncased logrando la mayor precisión de 0.73 en el conjunto de prueba. Nuestros hallazgos subrayan la eficacia y aplicabilidad de los modelos de aprendizaje automático tradicional y de aprendizaje profundo en el análisis de tendencias de sentimiento dentro del contexto de escenarios de bajo recurso en lengua española y temas emergentes como COVID-19.

Otros recursos que podrían interesarte

Temas Virtualpro