Pre-entrenamiento en datos mixtos para traducción automática neuronal de bajos recursos

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Pre-entrenamiento en datos mixtos para traducción automática neuronal de bajos recursos

Autores: Zhang, Wenbo; Li, Xiao; Yang, Yating; Dong, Rui

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

Pre-entrenamiento en datos mixtos para traducción automática neuronal de bajos recursos

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Preentrenamiento

Modo de ajuste fino

Traducción automática neuronal

Datos monolingües

Modelos de traducción

Datos bilingües

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

El modo de pre-entrenamiento y ajuste fino ha demostrado ser efectivo para la traducción automática neuronal en recursos limitados. En este modo, se utilizan modelos de pre-entrenamiento entrenados con datos monolingües para iniciar modelos de traducción y transferir conocimiento de los datos monolingües a los modelos de traducción. En los últimos años, los modelos de pre-entrenamiento suelen tomar oraciones con palabras enmascaradas aleatoriamente como entrada y se entrenan prediciendo estas palabras enmascaradas en función de las palabras no enmascaradas. En este artículo, proponemos un nuevo método de pre-entrenamiento que aún predice palabras enmascaradas, pero reemplaza aleatoriamente algunas de las palabras no enmascaradas en la entrada con sus palabras de traducción en otro idioma. Las palabras de traducción provienen de datos bilingües, de modo que los datos para el pre-entrenamiento contienen tanto datos monolingües como bilingües. Realizamos experimentos en un corpus uigur-chino para evaluar nuestro método. Los resultados experimentales muestran que nuestro método puede hacer que el modelo de pre-entrenamiento tenga una mejor capacidad de generalización y ayudar al modelo de traducción a lograr un mejor rendimiento. A través de una tarea de traducción de palabras, también demostramos que nuestro método permite que la incrustación del modelo de traducción adquiera más conocimiento de alineación.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro