Modelos de lenguaje compuestos basados en transformadores para evaluación y clasificación de texto

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Modelos de lenguaje compuestos basados en transformadores para evaluación y clasificación de texto

Autores: kori, Mihailo; Utvi, Milo; Stankovi, Ranka

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Modelos de lenguaje compuestos basados en transformadores para evaluación y clasificación de texto

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Sistemas de procesamiento de lenguaje natural

Modelos de lenguaje compuestos

Conjunto de datos basado en perplejidad

Corpus de lenguaje serbio

Tareas de clasificación binaria

Clasificador apilado

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones

Los sistemas paralelos de procesamiento de lenguaje natural fueron previamente probados con éxito en las tareas de etiquetado de partes del discurso y atribución de autoría a través de la modelización de mini-lenguaje, para lo cual lograron resultados significativamente mejores que los métodos independientes en los casos de siete idiomas europeos. El objetivo de este documento es presentar las ventajas de utilizar modelos de lenguaje compuestos en el procesamiento y evaluación de textos escritos en un lenguaje natural arbitrariamente altamente inflexivo y rico en morfología, particularmente en serbio. Un conjunto de datos basado en perplejidad, el principal activo para la evaluación de la metodología, fue creado utilizando una serie de transformadores pre-entrenados generativos entrenados en diferentes representaciones del corpus del idioma serbio y un conjunto de oraciones clasificadas en tres grupos (traducciones expertas, traducciones corruptas y traducciones automáticas). El documento describe un análisis comparativo de las perplejidades calculadas para medir la capacidad de clasificación de diferentes modelos en dos tareas de clasificación binaria. En el transcurso del experimento, probamos tres modelos de lenguaje independientes (base) y dos modelos de lenguaje compuestos (que se basan en las perplejidades producidas por los tres modelos independientes). Los resultados presentados destacan un clasificador apilado complejo que utiliza una multitud de características extraídas de los vectores de perplejidad como la arquitectura óptima de los modelos de lenguaje compuestos para ambas tareas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro