Modelos de lenguaje compuestos basados en transformadores para evaluación y clasificación de texto
Autores: kori, Mihailo; Utvi, Milo; Stankovi, Ranka
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Modelos de lenguaje compuestos basados en transformadores para evaluación y clasificación de texto
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Sistemas de procesamiento de lenguaje natural
Modelos de lenguaje compuestos
Conjunto de datos basado en perplejidad
Corpus de lenguaje serbio
Tareas de clasificación binaria
Clasificador apilado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Los sistemas paralelos de procesamiento de lenguaje natural fueron previamente probados con éxito en las tareas de etiquetado de partes del discurso y atribución de autoría a través de la modelización de mini-lenguaje, para lo cual lograron resultados significativamente mejores que los métodos independientes en los casos de siete idiomas europeos. El objetivo de este documento es presentar las ventajas de utilizar modelos de lenguaje compuestos en el procesamiento y evaluación de textos escritos en un lenguaje natural arbitrariamente altamente inflexivo y rico en morfología, particularmente en serbio. Un conjunto de datos basado en perplejidad, el principal activo para la evaluación de la metodología, fue creado utilizando una serie de transformadores pre-entrenados generativos entrenados en diferentes representaciones del corpus del idioma serbio y un conjunto de oraciones clasificadas en tres grupos (traducciones expertas, traducciones corruptas y traducciones automáticas). El documento describe un análisis comparativo de las perplejidades calculadas para medir la capacidad de clasificación de diferentes modelos en dos tareas de clasificación binaria. En el transcurso del experimento, probamos tres modelos de lenguaje independientes (base) y dos modelos de lenguaje compuestos (que se basan en las perplejidades producidas por los tres modelos independientes). Los resultados presentados destacan un clasificador apilado complejo que utiliza una multitud de características extraídas de los vectores de perplejidad como la arquitectura óptima de los modelos de lenguaje compuestos para ambas tareas.
Descripción
Los sistemas paralelos de procesamiento de lenguaje natural fueron previamente probados con éxito en las tareas de etiquetado de partes del discurso y atribución de autoría a través de la modelización de mini-lenguaje, para lo cual lograron resultados significativamente mejores que los métodos independientes en los casos de siete idiomas europeos. El objetivo de este documento es presentar las ventajas de utilizar modelos de lenguaje compuestos en el procesamiento y evaluación de textos escritos en un lenguaje natural arbitrariamente altamente inflexivo y rico en morfología, particularmente en serbio. Un conjunto de datos basado en perplejidad, el principal activo para la evaluación de la metodología, fue creado utilizando una serie de transformadores pre-entrenados generativos entrenados en diferentes representaciones del corpus del idioma serbio y un conjunto de oraciones clasificadas en tres grupos (traducciones expertas, traducciones corruptas y traducciones automáticas). El documento describe un análisis comparativo de las perplejidades calculadas para medir la capacidad de clasificación de diferentes modelos en dos tareas de clasificación binaria. En el transcurso del experimento, probamos tres modelos de lenguaje independientes (base) y dos modelos de lenguaje compuestos (que se basan en las perplejidades producidas por los tres modelos independientes). Los resultados presentados destacan un clasificador apilado complejo que utiliza una multitud de características extraídas de los vectores de perplejidad como la arquitectura óptima de los modelos de lenguaje compuestos para ambas tareas.