Calidad de la traducción y reconocimiento de errores en la post-edición de traducción automática neuronal profesional
Autores: Vardaro, Jennifer; Schaeffer, Moritz; Hansen-Schirra, Silvia
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Calidad de la traducción y reconocimiento de errores en la post-edición de traducción automática neuronal profesional
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Expertos en traducción
Textos traducidos por máquinas neuronales
Versiones post-editadas
Categorías de errores
DGT
Aseguramiento de la calidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio tiene como objetivo analizar cómo los expertos en traducción del departamento alemán de la Dirección General de Traducción (DGT) de la Comisión Europea identifican y corrigen diferentes categorías de errores en textos traducidos por máquinas neuronales (NMT) y sus versiones post-editadas (NMTPE). El término experto en traducción abarca traductor, post-editor y revisor. Aunque nos centramos en segmentos traducidos por máquinas neuronales, traductor y post-editor se utilizan de manera sinónima debido al flujo de trabajo combinado que utiliza herramientas de traducción asistida por computadora (CAT) así como traducción automática. Solo la distinción entre post-editor, que se refiere a un experto en traducción de la DGT que corrige la salida de la traducción automática neuronal, y revisor, que se refiere a un experto en traducción de la DGT que corrige la versión post-editada de la salida de la traducción automática neuronal, es importante y se aclara siempre que sea relevante. Utilizando una herramienta automática de anotación de errores y un marco de anotación de errores manual más detallado para identificar categorías de errores características en los textos de la DGT, un análisis de corpus reveló que las medidas de aseguramiento de calidad por parte de los post-editores y revisores de la DGT son más a menudo necesarias para errores léxicos. Más específicamente, el análisis de corpus mostró que, si los post-editores corrigen errores de traducción, terminología o errores estilísticos en una oración NMT, es probable que los revisores corrijan el mismo tipo de error en la misma oración post-editada, lo que sugiere que los expertos de la DGT estaban siendo influenciados por la salida de NMT. Posteriormente, diseñamos un experimento controlado de seguimiento ocular y registro de teclas para comparar los movimientos oculares de los participantes para oraciones de prueba que contenían las tres categorías de errores identificadas (errores de traducción, errores de terminología o estilísticos) y para oraciones de control sin errores. Examinamos el efecto de los tres tipos de errores en medidas tempranas (duraciones de la primera fijación, duraciones del primer paso) y medidas de movimiento ocular tardías (por ejemplo, tiempo total de lectura y duraciones de la trayectoria de regresión). Los modelos de regresión de efectos mixtos lineales predicen qué tipo de comportamiento de los expertos de la DGT está asociado con la corrección de diferentes tipos de errores durante el proceso de post-edición.
Descripción
Este estudio tiene como objetivo analizar cómo los expertos en traducción del departamento alemán de la Dirección General de Traducción (DGT) de la Comisión Europea identifican y corrigen diferentes categorías de errores en textos traducidos por máquinas neuronales (NMT) y sus versiones post-editadas (NMTPE). El término experto en traducción abarca traductor, post-editor y revisor. Aunque nos centramos en segmentos traducidos por máquinas neuronales, traductor y post-editor se utilizan de manera sinónima debido al flujo de trabajo combinado que utiliza herramientas de traducción asistida por computadora (CAT) así como traducción automática. Solo la distinción entre post-editor, que se refiere a un experto en traducción de la DGT que corrige la salida de la traducción automática neuronal, y revisor, que se refiere a un experto en traducción de la DGT que corrige la versión post-editada de la salida de la traducción automática neuronal, es importante y se aclara siempre que sea relevante. Utilizando una herramienta automática de anotación de errores y un marco de anotación de errores manual más detallado para identificar categorías de errores características en los textos de la DGT, un análisis de corpus reveló que las medidas de aseguramiento de calidad por parte de los post-editores y revisores de la DGT son más a menudo necesarias para errores léxicos. Más específicamente, el análisis de corpus mostró que, si los post-editores corrigen errores de traducción, terminología o errores estilísticos en una oración NMT, es probable que los revisores corrijan el mismo tipo de error en la misma oración post-editada, lo que sugiere que los expertos de la DGT estaban siendo influenciados por la salida de NMT. Posteriormente, diseñamos un experimento controlado de seguimiento ocular y registro de teclas para comparar los movimientos oculares de los participantes para oraciones de prueba que contenían las tres categorías de errores identificadas (errores de traducción, errores de terminología o estilísticos) y para oraciones de control sin errores. Examinamos el efecto de los tres tipos de errores en medidas tempranas (duraciones de la primera fijación, duraciones del primer paso) y medidas de movimiento ocular tardías (por ejemplo, tiempo total de lectura y duraciones de la trayectoria de regresión). Los modelos de regresión de efectos mixtos lineales predicen qué tipo de comportamiento de los expertos de la DGT está asociado con la corrección de diferentes tipos de errores durante el proceso de post-edición.