logo móvil
Contáctanos

Modelos de lenguaje compuestos basados en transformadores para evaluación y clasificación de texto

Autores: kori, Mihailo; Utvi, Milo; Stankovi, Ranka

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Modelos de lenguaje compuestos basados en transformadores para evaluación y clasificación de texto


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Sistemas de procesamiento de lenguaje natural
Modelos de lenguaje compuestos
Conjunto de datos basado en perplejidad
Corpus de lenguaje serbio
Tareas de clasificación binaria
Clasificador apilado

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones


Descripción
Los sistemas paralelos de procesamiento de lenguaje natural fueron previamente probados con éxito en las tareas de etiquetado de partes del discurso y atribución de autoría a través de la modelización de mini-lenguaje, para lo cual lograron resultados significativamente mejores que los métodos independientes en los casos de siete idiomas europeos. El objetivo de este documento es presentar las ventajas de utilizar modelos de lenguaje compuestos en el procesamiento y evaluación de textos escritos en un lenguaje natural arbitrariamente altamente inflexivo y rico en morfología, particularmente en serbio. Un conjunto de datos basado en perplejidad, el principal activo para la evaluación de la metodología, fue creado utilizando una serie de transformadores pre-entrenados generativos entrenados en diferentes representaciones del corpus del idioma serbio y un conjunto de oraciones clasificadas en tres grupos (traducciones expertas, traducciones corruptas y traducciones automáticas). El documento describe un análisis comparativo de las perplejidades calculadas para medir la capacidad de clasificación de diferentes modelos en dos tareas de clasificación binaria. En el transcurso del experimento, probamos tres modelos de lenguaje independientes (base) y dos modelos de lenguaje compuestos (que se basan en las perplejidades producidas por los tres modelos independientes). Los resultados presentados destacan un clasificador apilado complejo que utiliza una multitud de características extraídas de los vectores de perplejidad como la arquitectura óptima de los modelos de lenguaje compuestos para ambas tareas.

Otros recursos que podrían interesarte

Temas Virtualpro