Traducción híbrida con clasificación: reconsiderando la traducción basada en reglas y la traducción neuronal automática
Autores: Huang, Jin-Xia; Lee, Kyung-Soon; Kim, Young-Kil
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Traducción híbrida con clasificación: reconsiderando la traducción basada en reglas y la traducción neuronal automática
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Propone un sistema de traducción híbrido
Traducción automática neuronal
Traducción automática basada en reglas
Fiabilidad de la traducción
Precisión de la clasificación.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Este documento propone un sistema híbrido de traducción automática que combina la traducción automática neuronal con la traducción automática basada en reglas bien desarrollada para utilizar la estabilidad de esta última y compensar la insuficiencia de la traducción automática neuronal en dominios de recursos raros. Se introduce un clasificador para predecir cuál traducción de los dos sistemas es más confiable. Exploramos un conjunto de características que reflejan la confiabilidad de la traducción y su proceso, y los datos de entrenamiento se amplían automáticamente con un pequeño conjunto de datos etiquetados por humanos para resolver el problema de datos insuficientes. Una serie de experimentos muestra que la precisión de la traducción del sistema híbrido se mejora, especialmente en traducciones fuera del dominio, y la precisión de la clasificación se mejora significativamente al usar las características propuestas y el conjunto de entrenamiento construido automáticamente. También se realiza una comparación entre la clasificación basada en características y en texto, y los resultados muestran que el modelo basado en características logra una mejor precisión de clasificación, incluso en comparación con los clasificadores de texto de redes neuronales.
Descripción
Este documento propone un sistema híbrido de traducción automática que combina la traducción automática neuronal con la traducción automática basada en reglas bien desarrollada para utilizar la estabilidad de esta última y compensar la insuficiencia de la traducción automática neuronal en dominios de recursos raros. Se introduce un clasificador para predecir cuál traducción de los dos sistemas es más confiable. Exploramos un conjunto de características que reflejan la confiabilidad de la traducción y su proceso, y los datos de entrenamiento se amplían automáticamente con un pequeño conjunto de datos etiquetados por humanos para resolver el problema de datos insuficientes. Una serie de experimentos muestra que la precisión de la traducción del sistema híbrido se mejora, especialmente en traducciones fuera del dominio, y la precisión de la clasificación se mejora significativamente al usar las características propuestas y el conjunto de entrenamiento construido automáticamente. También se realiza una comparación entre la clasificación basada en características y en texto, y los resultados muestran que el modelo basado en características logra una mejor precisión de clasificación, incluso en comparación con los clasificadores de texto de redes neuronales.