Clasificación de Sentimientos Basada en Aspectos en Árabe Usando Normalización de Dialectos Seq2Seq y Transformadores
Autores: Chennafi, Mohammed ElAmine; Bedlaoui, Hanane; Dahou, Abdelghani; Al-qaness, Mohammed A. A.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Clasificación de Sentimientos Basada en Aspectos en Árabe Usando Normalización de Dialectos Seq2Seq y Transformadores
Categoría
Gestión y administración
Subcategoría
Gestión del conocimiento
Palabras clave
Análisis de sentimientos
Procesamiento de lenguaje natural
SA en árabe
Análisis de sentimientos a nivel de aspecto
PLN en árabe
Tareas de ABSA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
El análisis de sentimientos es uno de los campos más importantes del procesamiento del lenguaje natural debido a su amplia gama de aplicaciones y los beneficios asociados con su uso. Se define como la identificación de la polaridad del sentimiento en el texto en lenguaje natural. Recientemente, los investigadores han centrado su atención en el análisis de sentimientos en árabe debido a la gran cantidad de contenido generado por los usuarios en las redes sociales y sitios web de comercio electrónico en el mundo árabe. La mayor parte de la investigación en este campo se centra en los niveles de oración y documento. Este estudio aborda el análisis de sentimientos a nivel de aspecto para el idioma árabe, que es una versión menos estudiada del análisis de sentimientos. Debido a que el procesamiento del lenguaje natural en árabe es un desafío y hay pocos recursos disponibles en árabe y muchos dialectos árabes, se han realizado estudios limitados para detectar análisis de sentimientos basados en aspectos en textos árabes. Específicamente, este estudio considera dos tareas de ABSA: la polaridad del término del aspecto y la polaridad de la categoría del aspecto, utilizando la normalización del texto del dialecto árabe después de realizar la tarea de clasificación. Presentamos un modelo Seq2Seq para la normalización de dialectos que puede servir como un paso de preprocesamiento para la tarea de clasificación de ABSA al reducir el número de palabras fuera de vocabulario. Así, la precisión del modelo aumentó. Los resultados de los experimentos realizados muestran que nuestros modelos superaron a los modelos existentes en la literatura en ambas tareas y conjuntos de datos.
Descripción
El análisis de sentimientos es uno de los campos más importantes del procesamiento del lenguaje natural debido a su amplia gama de aplicaciones y los beneficios asociados con su uso. Se define como la identificación de la polaridad del sentimiento en el texto en lenguaje natural. Recientemente, los investigadores han centrado su atención en el análisis de sentimientos en árabe debido a la gran cantidad de contenido generado por los usuarios en las redes sociales y sitios web de comercio electrónico en el mundo árabe. La mayor parte de la investigación en este campo se centra en los niveles de oración y documento. Este estudio aborda el análisis de sentimientos a nivel de aspecto para el idioma árabe, que es una versión menos estudiada del análisis de sentimientos. Debido a que el procesamiento del lenguaje natural en árabe es un desafío y hay pocos recursos disponibles en árabe y muchos dialectos árabes, se han realizado estudios limitados para detectar análisis de sentimientos basados en aspectos en textos árabes. Específicamente, este estudio considera dos tareas de ABSA: la polaridad del término del aspecto y la polaridad de la categoría del aspecto, utilizando la normalización del texto del dialecto árabe después de realizar la tarea de clasificación. Presentamos un modelo Seq2Seq para la normalización de dialectos que puede servir como un paso de preprocesamiento para la tarea de clasificación de ABSA al reducir el número de palabras fuera de vocabulario. Así, la precisión del modelo aumentó. Los resultados de los experimentos realizados muestran que nuestros modelos superaron a los modelos existentes en la literatura en ambas tareas y conjuntos de datos.