Modelo de aprendizaje multitarea basado en red de atención jerárquica para la clasificación del análisis de sentimientos en árabe
Autores: Alali, Muath; Mohd Sharef, Nurfadhlina; Azmi Murad, Masrah Azrifah; Hamdan, Hazlina; Husin, Nor Azura
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Modelo de aprendizaje multitarea basado en red de atención jerárquica para la clasificación del análisis de sentimientos en árabe
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
árabe
Análisis de sentimientos
Redes de atención jerárquica
Aprendizaje multi-tarea
Representación de oraciones
Idioma de recursos limitados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Se han aplicado enfoques limitados al análisis de sentimientos en árabe para un problema de clasificación de cinco puntos. Estos enfoques se basan en el aprendizaje de una sola tarea con una característica hecha a mano, lo que no proporciona una representación robusta de la oración. Recientemente, las redes de atención jerárquica han tenido un rendimiento excepcional. Sin embargo, al entrenar dichos modelos como aprendizaje de una sola tarea, estos modelos no muestran un rendimiento superior y una representación robusta de características latentes en el caso de una pequeña cantidad de datos, específicamente en el idioma árabe, que se considera un idioma de recursos limitados. Además, estos modelos se basan en el aprendizaje de una sola tarea y no consideran las tareas relacionadas, como tareas ternarias y binarias (transferencia entre tareas). Centrándonos en estas deficiencias, consideramos cinco tareas ternarias como relativas. Proponemos un modelo de aprendizaje multitarea basado en redes de atención jerárquica (MTLHAN) para aprender la mejor representación de oraciones y la generalización del modelo, con un codificador de palabras compartido y una red de atención en ambas tareas, entrenando de manera alternada y conjunta tareas de análisis de sentimientos en árabe de tres y cinco polaridades. Los resultados experimentales mostraron un rendimiento excepcional del modelo propuesto, con una alta precisión del 83.98%, 87.68% y 84.59 en los conjuntos de datos LABR, HARD y BRAD, respectivamente, y un error absoluto medio macro mínimo del 0.632% en el conjunto de datos de tweets en árabe para el problema de clasificación de sentimientos en árabe de cinco puntos.
Descripción
Se han aplicado enfoques limitados al análisis de sentimientos en árabe para un problema de clasificación de cinco puntos. Estos enfoques se basan en el aprendizaje de una sola tarea con una característica hecha a mano, lo que no proporciona una representación robusta de la oración. Recientemente, las redes de atención jerárquica han tenido un rendimiento excepcional. Sin embargo, al entrenar dichos modelos como aprendizaje de una sola tarea, estos modelos no muestran un rendimiento superior y una representación robusta de características latentes en el caso de una pequeña cantidad de datos, específicamente en el idioma árabe, que se considera un idioma de recursos limitados. Además, estos modelos se basan en el aprendizaje de una sola tarea y no consideran las tareas relacionadas, como tareas ternarias y binarias (transferencia entre tareas). Centrándonos en estas deficiencias, consideramos cinco tareas ternarias como relativas. Proponemos un modelo de aprendizaje multitarea basado en redes de atención jerárquica (MTLHAN) para aprender la mejor representación de oraciones y la generalización del modelo, con un codificador de palabras compartido y una red de atención en ambas tareas, entrenando de manera alternada y conjunta tareas de análisis de sentimientos en árabe de tres y cinco polaridades. Los resultados experimentales mostraron un rendimiento excepcional del modelo propuesto, con una alta precisión del 83.98%, 87.68% y 84.59 en los conjuntos de datos LABR, HARD y BRAD, respectivamente, y un error absoluto medio macro mínimo del 0.632% en el conjunto de datos de tweets en árabe para el problema de clasificación de sentimientos en árabe de cinco puntos.