logo móvil
Contáctanos

Cambiar modelo de clasificación de texto de autoatención con codificación posicional inversa innovadora para idiomas de derecha a izquierda: un enfoque en dialectos árabes

Autores: Baniata, Laith H.; Kang, Sangwoo

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Cambiar modelo de clasificación de texto de autoatención con codificación posicional inversa innovadora para idiomas de derecha a izquierda: un enfoque en dialectos árabes


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Modelos de transformador
Mecanismos de autoatención
Clasificación de texto
Textos en árabe
Codificación Posicional Reversa (RPE)
Mezcla de Expertos (MoE)

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 52

Citaciones: Sin citaciones


Descripción
Los modelos de transformadores han surgido como líderes en el campo del procesamiento del lenguaje natural, principalmente debido a su hábil uso de mecanismos de autoatención para comprender las relaciones semánticas entre las palabras en secuencias. A pesar de sus fortalezas, estos modelos a menudo enfrentan desafíos en escenarios de aprendizaje de una sola tarea, especialmente en lo que respecta a ofrecer un rendimiento de alta calidad y crear representaciones de características latentes sólidas. Este desafío es más pronunciado en el contexto de conjuntos de datos más pequeños y es particularmente agudo para idiomas con recursos limitados como el árabe. A la luz de estos desafíos, este estudio introduce una metodología novedosa para la clasificación de textos en árabe. Este método aprovecha la técnica de Codificación Posicional Reversa (RPE) recientemente desarrollada. Adopta un marco de aprendizaje por transferencia inductiva (ITL) combinado con un codificador compartido de autoatención conmutada, aumentando así la adaptabilidad del modelo y mejorando la precisión de su representación de oraciones. La integración de las técnicas de Mezcla de Expertos (MoE) y RPE potencia al modelo para procesar secuencias más largas de manera más efectiva. Esta mejora es notablemente beneficiosa para la clasificación de textos en árabe, apoyando hábilmente tanto las tareas de clasificación de cinco puntos intrincadas como las más simples de clasificación ternaria. La evidencia empírica apunta a su rendimiento sobresaliente, logrando tasas de precisión del 87,20% para el conjunto de datos HARD, del 72,17% para el conjunto de datos BRAD y del 86,89% para el conjunto de datos LABR, según lo evidencian las evaluaciones realizadas en estos conjuntos de datos.

Otros recursos que podrían interesarte

Temas Virtualpro