Hacia una mejor integración de coincidencias difusas en la traducción automática neuronal a través de la ampliación de datos
Autores: Tezcan, Arda; Bulté, Bram; Vanroy, Bram
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Hacia una mejor integración de coincidencias difusas en la traducción automática neuronal a través de la ampliación de datos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reparación difusa neural
Coincidencias de memoria de traducción
Traducción automática neural
Técnicas de coincidencia difusa
Segmentación a nivel de subpalabra
Características basadas en alineación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Identificamos una serie de aspectos que pueden mejorar el rendimiento de la Reparación Neuronal Difusa (NFR), un método fácil de implementar para integrar coincidencias de memoria de traducción y traducción automática neuronal (NMT). Exploramos diversas formas de maximizar el valor añadido de las coincidencias recuperadas dentro del paradigma NFR para ocho combinaciones de idiomas, utilizando sistemas NMT basados en Transformer. En particular, probamos el impacto de diferentes técnicas de coincidencia difusa, métodos de segmentación a nivel de subpalabra y características basadas en alineación en la calidad general de la traducción. Además, proponemos una técnica de combinación de coincidencias difusas que busca maximizar la cobertura de palabras fuente. Esto se complementa con un análisis de cómo la calidad de la traducción se ve afectada por la longitud de la oración de entrada y la puntuación de coincidencia difusa. Los resultados muestran que aplicar una combinación de las modificaciones probadas conduce a un aumento significativo en la calidad de traducción estimada sobre todas las líneas base para todas las combinaciones de idiomas.
Descripción
Identificamos una serie de aspectos que pueden mejorar el rendimiento de la Reparación Neuronal Difusa (NFR), un método fácil de implementar para integrar coincidencias de memoria de traducción y traducción automática neuronal (NMT). Exploramos diversas formas de maximizar el valor añadido de las coincidencias recuperadas dentro del paradigma NFR para ocho combinaciones de idiomas, utilizando sistemas NMT basados en Transformer. En particular, probamos el impacto de diferentes técnicas de coincidencia difusa, métodos de segmentación a nivel de subpalabra y características basadas en alineación en la calidad general de la traducción. Además, proponemos una técnica de combinación de coincidencias difusas que busca maximizar la cobertura de palabras fuente. Esto se complementa con un análisis de cómo la calidad de la traducción se ve afectada por la longitud de la oración de entrada y la puntuación de coincidencia difusa. Los resultados muestran que aplicar una combinación de las modificaciones probadas conduce a un aumento significativo en la calidad de traducción estimada sobre todas las líneas base para todas las combinaciones de idiomas.