Traducción automática de Twi
Autores: Gyasi, Frederick; Schlippe, Tim
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Traducción automática de Twi
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Francés
Twi
Traducción automática
Corpus paralelo
Comercio
Creación de empleo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 46
Citaciones: Sin citaciones
El francés es un idioma estratégica y económicamente importante en las regiones donde se habla el idioma africano Twi. Sin embargo, solo una pequeña proporción de hablantes de Twi en Ghana hablan francés. El desarrollo de un corpus paralelo Twi-francés y aplicaciones de traducción automática correspondientes proporcionaría varias ventajas, como estimular el comercio y la creación de empleo, apoyar a la diáspora ghanesa en naciones de habla francesa, ayudar a turistas de habla francesa e inmigrantes que buscan atención médica en Ghana, y facilitar numerosas tareas de procesamiento de lenguaje natural. Dado que apenas existen sistemas de traducción automática o corpus paralelos entre Twi y francés que cubran un vocabulario moderno y versátil, nuestro objetivo era ampliar un corpus Twi-Inglés moderno con francés y desarrollar sistemas de traducción automática entre Twi y francés: En consecuencia, en este documento, presentamos nuestro corpus Twi-francés de 10,708 oraciones paralelas. Además, describimos nuestros experimentos de traducción automática con este corpus. Investigamos sistemas de traducción automática directa y en cascada que utilizan el inglés como idioma pivote. Nuestro mejor sistema Twi-francés es un sistema directo de traducción automática basado en transformers de última generación que logra un puntaje BLEU de 0.76. Nuestro mejor sistema francés-Twi, que es un sistema en cascada que utiliza el inglés como idioma pivote, obtiene un puntaje BLEU de 0.81. Ambos sistemas están ajustados con nuestro corpus, y nuestro sistema francés-Twi incluso supera ligeramente a Google Translate en nuestro conjunto de pruebas en un 7% relativo.
Descripción
El francés es un idioma estratégica y económicamente importante en las regiones donde se habla el idioma africano Twi. Sin embargo, solo una pequeña proporción de hablantes de Twi en Ghana hablan francés. El desarrollo de un corpus paralelo Twi-francés y aplicaciones de traducción automática correspondientes proporcionaría varias ventajas, como estimular el comercio y la creación de empleo, apoyar a la diáspora ghanesa en naciones de habla francesa, ayudar a turistas de habla francesa e inmigrantes que buscan atención médica en Ghana, y facilitar numerosas tareas de procesamiento de lenguaje natural. Dado que apenas existen sistemas de traducción automática o corpus paralelos entre Twi y francés que cubran un vocabulario moderno y versátil, nuestro objetivo era ampliar un corpus Twi-Inglés moderno con francés y desarrollar sistemas de traducción automática entre Twi y francés: En consecuencia, en este documento, presentamos nuestro corpus Twi-francés de 10,708 oraciones paralelas. Además, describimos nuestros experimentos de traducción automática con este corpus. Investigamos sistemas de traducción automática directa y en cascada que utilizan el inglés como idioma pivote. Nuestro mejor sistema Twi-francés es un sistema directo de traducción automática basado en transformers de última generación que logra un puntaje BLEU de 0.76. Nuestro mejor sistema francés-Twi, que es un sistema en cascada que utiliza el inglés como idioma pivote, obtiene un puntaje BLEU de 0.81. Ambos sistemas están ajustados con nuestro corpus, y nuestro sistema francés-Twi incluso supera ligeramente a Google Translate en nuestro conjunto de pruebas en un 7% relativo.