Un Análisis Experimental de Metodologías de Anotación de Datos para la Detección de Emociones en Textos Cortos Publicados en Redes Sociales
Autores: Krommyda, Maria; Rigos, Anastasios; Bouklas, Kostas; Amditis, Angelos
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un Análisis Experimental de Metodologías de Anotación de Datos para la Detección de Emociones en Textos Cortos Publicados en Redes Sociales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Técnicas de minería de opiniones
Positivo
Negativo
Análisis de emociones
Soluciones de aprendizaje automático
Conjuntos de datos de entrenamiento anotados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las técnicas de minería de opiniones, que investigan si un texto expresa una opinión positiva o negativa, ganan continuamente en popularidad, atrayendo la atención de muchos científicos de diferentes disciplinas. Sin embargo, los casos de uso específicos, donde la opinión expresada es indiscutiblemente positiva o negativa, hacen que tales soluciones queden obsoletas y enfatizan la necesidad de un análisis más profundo del texto disponible. El análisis de emociones es una solución a este problema, pero los elementos multidimensionales de las emociones expresadas en el texto, junto con la complejidad de las características que permiten su identificación, representan un desafío significativo. Las soluciones de aprendizaje automático no logran alcanzar una alta precisión, principalmente debido a la disponibilidad limitada de conjuntos de datos de entrenamiento anotados y al sesgo introducido en las anotaciones por las interpretaciones personales de las emociones de los individuos. En este documento se propone un algoritmo híbrido basado en reglas que permite la adquisición de un conjunto de datos anotado en relación con las ocho emociones básicas de Plutchik. Se utilizan emojis, palabras clave y relaciones semánticas para identificar de manera objetiva y sin sesgos la emoción expresada en una frase o texto corto. Los conjuntos de datos adquiridos se utilizan para entrenar modelos de clasificación de aprendizaje automático. La precisión de los modelos y los parámetros que la afectan se presentan en detalle a través de un análisis experimental. Se selecciona el modelo más preciso y se ofrece a través de una API para abordar la detección de emociones en publicaciones en redes sociales.
Descripción
Las técnicas de minería de opiniones, que investigan si un texto expresa una opinión positiva o negativa, ganan continuamente en popularidad, atrayendo la atención de muchos científicos de diferentes disciplinas. Sin embargo, los casos de uso específicos, donde la opinión expresada es indiscutiblemente positiva o negativa, hacen que tales soluciones queden obsoletas y enfatizan la necesidad de un análisis más profundo del texto disponible. El análisis de emociones es una solución a este problema, pero los elementos multidimensionales de las emociones expresadas en el texto, junto con la complejidad de las características que permiten su identificación, representan un desafío significativo. Las soluciones de aprendizaje automático no logran alcanzar una alta precisión, principalmente debido a la disponibilidad limitada de conjuntos de datos de entrenamiento anotados y al sesgo introducido en las anotaciones por las interpretaciones personales de las emociones de los individuos. En este documento se propone un algoritmo híbrido basado en reglas que permite la adquisición de un conjunto de datos anotado en relación con las ocho emociones básicas de Plutchik. Se utilizan emojis, palabras clave y relaciones semánticas para identificar de manera objetiva y sin sesgos la emoción expresada en una frase o texto corto. Los conjuntos de datos adquiridos se utilizan para entrenar modelos de clasificación de aprendizaje automático. La precisión de los modelos y los parámetros que la afectan se presentan en detalle a través de un análisis experimental. Se selecciona el modelo más preciso y se ofrece a través de una API para abordar la detección de emociones en publicaciones en redes sociales.