Evaluando características más ricas y modelos de aprendizaje automático variados para la clasificación de subjetividad de oraciones de reseñas de libros en portugués
Autores: Belisário, Luana Balador; Ferreira, Luiz Gabriel; Pardo, Thiago Alexandre Salgueiro
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Evaluando características más ricas y modelos de aprendizaje automático variados para la clasificación de subjetividad de oraciones de reseñas de libros en portugués
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Textos
Redes sociales
Empresas
Análisis de sentimientos
Clasificación de subjetividad
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los textos publicados en redes sociales han sido una fuente valiosa de información para empresas y usuarios, ya que el análisis de estos datos ayuda a mejorar/seleccionar productos y servicios de interés. Debido a la gran cantidad de datos, son necesarias técnicas para analizar automáticamente las opiniones de los usuarios. El campo de investigación que investiga estas técnicas se llama análisis de sentimientos. Este artículo se centra específicamente en la tarea de clasificación de subjetividad, que tiene como objetivo predecir si un pasaje de texto transmite una opinión. Informamos sobre el estudio y la comparación de métodos de aprendizaje automático de diferentes paradigmas para realizar la clasificación de subjetividad de oraciones de reseñas de libros en portugués, que han demostrado ser un dominio desafiante en el área. Específicamente, exploramos características más ricas para la tarea, utilizando varias características léxicas, basadas en centralidad y de discurso. Mostramos las contribuciones de los diferentes conjuntos de características y evidenciamos que la combinación de características léxicas, basadas en centralidad y de discurso produce mejores resultados que cualquiera de los conjuntos de características individualmente. Además, al analizar los resultados obtenidos y el conocimiento adquirido por algunos métodos de aprendizaje automático simbólico, mostramos que algunas relaciones de discurso pueden señalar claramente la subjetividad. Nuestra anotación de corpus también revela algunos patrones distintivos de estructuración del discurso para la subjetividad de las oraciones.
Descripción
Los textos publicados en redes sociales han sido una fuente valiosa de información para empresas y usuarios, ya que el análisis de estos datos ayuda a mejorar/seleccionar productos y servicios de interés. Debido a la gran cantidad de datos, son necesarias técnicas para analizar automáticamente las opiniones de los usuarios. El campo de investigación que investiga estas técnicas se llama análisis de sentimientos. Este artículo se centra específicamente en la tarea de clasificación de subjetividad, que tiene como objetivo predecir si un pasaje de texto transmite una opinión. Informamos sobre el estudio y la comparación de métodos de aprendizaje automático de diferentes paradigmas para realizar la clasificación de subjetividad de oraciones de reseñas de libros en portugués, que han demostrado ser un dominio desafiante en el área. Específicamente, exploramos características más ricas para la tarea, utilizando varias características léxicas, basadas en centralidad y de discurso. Mostramos las contribuciones de los diferentes conjuntos de características y evidenciamos que la combinación de características léxicas, basadas en centralidad y de discurso produce mejores resultados que cualquiera de los conjuntos de características individualmente. Además, al analizar los resultados obtenidos y el conocimiento adquirido por algunos métodos de aprendizaje automático simbólico, mostramos que algunas relaciones de discurso pueden señalar claramente la subjetividad. Nuestra anotación de corpus también revela algunos patrones distintivos de estructuración del discurso para la subjetividad de las oraciones.