Cambiar modelo de clasificación de texto de autoatención con codificación posicional inversa innovadora para idiomas de derecha a izquierda: un enfoque en dialectos árabes
Autores: Baniata, Laith H.; Kang, Sangwoo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Cambiar modelo de clasificación de texto de autoatención con codificación posicional inversa innovadora para idiomas de derecha a izquierda: un enfoque en dialectos árabes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelos de transformador
Mecanismos de autoatención
Clasificación de texto
Textos en árabe
Codificación Posicional Reversa (RPE)
Mezcla de Expertos (MoE)
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 52
Citaciones: Sin citaciones
Los modelos de transformadores han surgido como líderes en el campo del procesamiento del lenguaje natural, principalmente debido a su hábil uso de mecanismos de autoatención para comprender las relaciones semánticas entre las palabras en secuencias. A pesar de sus fortalezas, estos modelos a menudo enfrentan desafíos en escenarios de aprendizaje de una sola tarea, especialmente en lo que respecta a ofrecer un rendimiento de alta calidad y crear representaciones de características latentes sólidas. Este desafío es más pronunciado en el contexto de conjuntos de datos más pequeños y es particularmente agudo para idiomas con recursos limitados como el árabe. A la luz de estos desafíos, este estudio introduce una metodología novedosa para la clasificación de textos en árabe. Este método aprovecha la técnica de Codificación Posicional Reversa (RPE) recientemente desarrollada. Adopta un marco de aprendizaje por transferencia inductiva (ITL) combinado con un codificador compartido de autoatención conmutada, aumentando así la adaptabilidad del modelo y mejorando la precisión de su representación de oraciones. La integración de las técnicas de Mezcla de Expertos (MoE) y RPE potencia al modelo para procesar secuencias más largas de manera más efectiva. Esta mejora es notablemente beneficiosa para la clasificación de textos en árabe, apoyando hábilmente tanto las tareas de clasificación de cinco puntos intrincadas como las más simples de clasificación ternaria. La evidencia empírica apunta a su rendimiento sobresaliente, logrando tasas de precisión del 87,20% para el conjunto de datos HARD, del 72,17% para el conjunto de datos BRAD y del 86,89% para el conjunto de datos LABR, según lo evidencian las evaluaciones realizadas en estos conjuntos de datos.
Descripción
Los modelos de transformadores han surgido como líderes en el campo del procesamiento del lenguaje natural, principalmente debido a su hábil uso de mecanismos de autoatención para comprender las relaciones semánticas entre las palabras en secuencias. A pesar de sus fortalezas, estos modelos a menudo enfrentan desafíos en escenarios de aprendizaje de una sola tarea, especialmente en lo que respecta a ofrecer un rendimiento de alta calidad y crear representaciones de características latentes sólidas. Este desafío es más pronunciado en el contexto de conjuntos de datos más pequeños y es particularmente agudo para idiomas con recursos limitados como el árabe. A la luz de estos desafíos, este estudio introduce una metodología novedosa para la clasificación de textos en árabe. Este método aprovecha la técnica de Codificación Posicional Reversa (RPE) recientemente desarrollada. Adopta un marco de aprendizaje por transferencia inductiva (ITL) combinado con un codificador compartido de autoatención conmutada, aumentando así la adaptabilidad del modelo y mejorando la precisión de su representación de oraciones. La integración de las técnicas de Mezcla de Expertos (MoE) y RPE potencia al modelo para procesar secuencias más largas de manera más efectiva. Esta mejora es notablemente beneficiosa para la clasificación de textos en árabe, apoyando hábilmente tanto las tareas de clasificación de cinco puntos intrincadas como las más simples de clasificación ternaria. La evidencia empírica apunta a su rendimiento sobresaliente, logrando tasas de precisión del 87,20% para el conjunto de datos HARD, del 72,17% para el conjunto de datos BRAD y del 86,89% para el conjunto de datos LABR, según lo evidencian las evaluaciones realizadas en estos conjuntos de datos.