logo móvil
Contáctanos

Investigando la Influencia Contextual en la Traducción a Nivel de Documento

Autores: Nayak, Prashanth; Haque, Rejwanul; Kelleher, John D.; Way, Andy

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Investigando la Influencia Contextual en la Traducción a Nivel de Documento


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Traducción automática neuronal
Contexto a nivel de documento
Red de atención jerárquica
Predicción de traducción
Información contextual
Modelos conscientes del contexto

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los arquitecturas actuales de traducción automática neuronal (NMT) generalmente no tienen en cuenta el contexto a nivel de documento. Sin embargo, el contexto a nivel de documento de una oración fuente que se va a traducir podría codificar información valiosa para guiar al modelo de MT a generar una mejor traducción. En tiempos recientes, los investigadores de MT han centrado su atención en esta línea de investigación. Como ejemplo, los modelos de red de atención jerárquica (HAN) utilizan el contexto a nivel de documento para la predicción de traducción. En este trabajo, estudiamos las traducciones producidas por los sistemas de MT basados en HAN. Examinamos cómo la información contextual mejora la traducción en NMT a nivel de documento. Más específicamente, investigamos por qué los modelos conscientes del contexto, como HAN, funcionan mejor que los sistemas de NMT básicos que no tienen en cuenta el contexto. Consideramos el hindi-inglés, español-inglés y chino-inglés para nuestra investigación. Experimentamos con la formación de contexto condicional (es decir, oraciones vecinas) de las oraciones fuente que se van a traducir en HAN para predecir sus traducciones objetivo. Curiosamente, observamos que la calidad de las traducciones objetivo de oraciones fuente específicas se relaciona en gran medida con el contexto en el que aparecen las oraciones fuente. Basándonos en su sensibilidad al contexto, clasificamos nuestras oraciones del conjunto de pruebas en tres categorías, es decir, sensibles al contexto, insensibles al contexto y normales. Creemos que esta categorización puede cambiar la forma en que se utiliza el contexto en la traducción a nivel de documento.

Otros recursos que podrían interesarte

Temas Virtualpro