Traducción de Terminología en Escenarios de Bajos Recursos
Autores: Haque, Rejwanul; Hasanuzzaman, Mohammed; Way, Andy
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Traducción de Terminología en Escenarios de Bajos Recursos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Calidad de la traducción de términos
Traducción automática
Evaluación
Traducción de terminología
Marco de clasificación
Errores
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La calidad de la traducción de términos en la traducción automática (TA), que generalmente es evaluada por expertos en la materia, es una tarea que consume mucho tiempo y es costosa. De hecho, esto es inimaginable en un entorno industrial donde los sistemas de TA personalizados a menudo necesitan ser actualizados por muchas razones (por ejemplo, disponibilidad de nuevos datos de entrenamiento, técnicas de TA líderes). Hasta donde sabemos, hasta ahora no existe una solución disponible públicamente para evaluar automáticamente la traducción de términos en la TA. Por lo tanto, hay una necesidad genuina de tener una solución más rápida y menos costosa para este problema, que podría ayudar a los usuarios finales a identificar problemas de traducción de términos en la TA de inmediato. Este estudio presenta una estrategia más rápida y menos costosa para evaluar la traducción de términos en la TA. Las altas correlaciones de nuestros resultados de evaluación con los juicios humanos demuestran la efectividad de la solución propuesta. El documento también introduce un marco de clasificación, TermCat, que puede clasificar automáticamente errores relacionados con la traducción de términos y exponer problemas específicos en relación con la traducción de términos en la TA. Realizamos nuestros experimentos con un par de idiomas de bajos recursos, inglés-hindi, y encontramos que nuestro clasificador, cuya precisión varía según las direcciones de traducción, las clases de errores, la naturaleza morfológica de los idiomas y los modelos de TA, generalmente se desempeña de manera competente en la tarea de clasificación de traducción de términos.
Descripción
La calidad de la traducción de términos en la traducción automática (TA), que generalmente es evaluada por expertos en la materia, es una tarea que consume mucho tiempo y es costosa. De hecho, esto es inimaginable en un entorno industrial donde los sistemas de TA personalizados a menudo necesitan ser actualizados por muchas razones (por ejemplo, disponibilidad de nuevos datos de entrenamiento, técnicas de TA líderes). Hasta donde sabemos, hasta ahora no existe una solución disponible públicamente para evaluar automáticamente la traducción de términos en la TA. Por lo tanto, hay una necesidad genuina de tener una solución más rápida y menos costosa para este problema, que podría ayudar a los usuarios finales a identificar problemas de traducción de términos en la TA de inmediato. Este estudio presenta una estrategia más rápida y menos costosa para evaluar la traducción de términos en la TA. Las altas correlaciones de nuestros resultados de evaluación con los juicios humanos demuestran la efectividad de la solución propuesta. El documento también introduce un marco de clasificación, TermCat, que puede clasificar automáticamente errores relacionados con la traducción de términos y exponer problemas específicos en relación con la traducción de términos en la TA. Realizamos nuestros experimentos con un par de idiomas de bajos recursos, inglés-hindi, y encontramos que nuestro clasificador, cuya precisión varía según las direcciones de traducción, las clases de errores, la naturaleza morfológica de los idiomas y los modelos de TA, generalmente se desempeña de manera competente en la tarea de clasificación de traducción de términos.