Traducción automática entre Kreol Morisien e inglés utilizando el marco de traducción automática Marian
Autores: Boodeea, Zaheenah Beebee Jameela; Pudaruth, Sameerchand; Chooramun, Nitish; Sukhoo, Aneerav
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Traducción automática entre Kreol Morisien e inglés utilizando el marco de traducción automática Marian
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Herencia multicultural vibrante
Lenguas con pocos recursos
Estandarización
Sistema de traducción
Puntuaciones BLEU
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El Kreol Morisien es un idioma vibrante y expresivo que refleja la herencia multicultural de Mauricio. Existen diferentes versiones de los idiomas kreol. Mientras que el Kreol Morisien se habla en Mauricio, el Kreol Rodrige se habla solo en Rodrigues, y son idiomas distintos. Hablado por solo alrededor de 1.5 millones de hablantes en el mundo, el Kreol Morisien se encuentra en la categoría de idiomas con pocos recursos. Inicialmente, el Kreol Morisien carecía de un sistema de escritura formalizado, con muchas personas utilizando diferentes ortografías para las mismas palabras. El primer paso hacia la estandarización de la escritura del Kreol Morisien fue después de la publicación de la ortografía del Kreol Morisien en 2011 y la gramática del Kreol Morisien en 2012 por la Academia del Kreol Morisien. El Kreol Morisien obtuvo una posición nacional en el año 2012 cuando se introdujo en organizaciones educativas. Este fue un gran avance para que el Kreol Morisien fuera reconocido como un idioma nacional al mismo nivel que el inglés, el francés y otros idiomas orientales. Al proporcionar un medio para que los hablantes de Kreol Morisien se conecten con otros, un sistema de traducción ayudará a preservar y fortalecer la identidad del idioma y sus hablantes en un mundo cada vez más globalizado. El objetivo de este documento es desarrollar un sistema de traducción para el Kreol Morisien y el inglés. Así, se creó un conjunto de datos que consiste en 50,000 oraciones paralelas en Kreol Morisien e inglés, donde se utilizaron 48,000 pares de oraciones para entrenar los modelos, mientras que 1,000 oraciones se utilizaron para la evaluación y otras 1,000 oraciones se utilizaron para las pruebas. Se entrenaron y evaluaron varios sistemas de traducción automática, como la traducción automática estadística, la traducción automática neuronal de código abierto, un modelo Transformer con mecanismo de atención y la traducción automática Marian. Nuestro mejor modelo, utilizando MarianMT, logró una puntuación BLEU de 0.62 para la traducción del inglés al Kreol Morisien y una puntuación BLEU de 0.58 para la traducción del Kreol Morisien al inglés. Hasta donde sabemos, estas son las puntuaciones BLEU más altas que están disponibles en la literatura para este par de idiomas. Una herramienta de traducción de alta calidad para el Kreol Morisien facilitará su integración en plataformas digitales. Esto hará que el conocimiento previamente inaccesible sea más accesible, ya que la información ahora puede ser traducida al idioma materno de la mayoría de los mauricianos con una precisión razonable.
Descripción
El Kreol Morisien es un idioma vibrante y expresivo que refleja la herencia multicultural de Mauricio. Existen diferentes versiones de los idiomas kreol. Mientras que el Kreol Morisien se habla en Mauricio, el Kreol Rodrige se habla solo en Rodrigues, y son idiomas distintos. Hablado por solo alrededor de 1.5 millones de hablantes en el mundo, el Kreol Morisien se encuentra en la categoría de idiomas con pocos recursos. Inicialmente, el Kreol Morisien carecía de un sistema de escritura formalizado, con muchas personas utilizando diferentes ortografías para las mismas palabras. El primer paso hacia la estandarización de la escritura del Kreol Morisien fue después de la publicación de la ortografía del Kreol Morisien en 2011 y la gramática del Kreol Morisien en 2012 por la Academia del Kreol Morisien. El Kreol Morisien obtuvo una posición nacional en el año 2012 cuando se introdujo en organizaciones educativas. Este fue un gran avance para que el Kreol Morisien fuera reconocido como un idioma nacional al mismo nivel que el inglés, el francés y otros idiomas orientales. Al proporcionar un medio para que los hablantes de Kreol Morisien se conecten con otros, un sistema de traducción ayudará a preservar y fortalecer la identidad del idioma y sus hablantes en un mundo cada vez más globalizado. El objetivo de este documento es desarrollar un sistema de traducción para el Kreol Morisien y el inglés. Así, se creó un conjunto de datos que consiste en 50,000 oraciones paralelas en Kreol Morisien e inglés, donde se utilizaron 48,000 pares de oraciones para entrenar los modelos, mientras que 1,000 oraciones se utilizaron para la evaluación y otras 1,000 oraciones se utilizaron para las pruebas. Se entrenaron y evaluaron varios sistemas de traducción automática, como la traducción automática estadística, la traducción automática neuronal de código abierto, un modelo Transformer con mecanismo de atención y la traducción automática Marian. Nuestro mejor modelo, utilizando MarianMT, logró una puntuación BLEU de 0.62 para la traducción del inglés al Kreol Morisien y una puntuación BLEU de 0.58 para la traducción del Kreol Morisien al inglés. Hasta donde sabemos, estas son las puntuaciones BLEU más altas que están disponibles en la literatura para este par de idiomas. Una herramienta de traducción de alta calidad para el Kreol Morisien facilitará su integración en plataformas digitales. Esto hará que el conocimiento previamente inaccesible sea más accesible, ya que la información ahora puede ser traducida al idioma materno de la mayoría de los mauricianos con una precisión razonable.