Identificando dialectos de origen en la traducción
Autores: Nisioi, Sergiu; Uban, Ana Sabina; Dinu, Liviu P.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Identificando dialectos de origen en la traducción
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Explorar
Textos traducidos
Características lingüísticas
Variedades dialectales
Conjunto de datos
Inglés escrito
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
En este documento, pretendemos explorar el grado en que los textos traducidos preservan las características lingüísticas de las variedades dialectales. Publicamos un conjunto de datos de anotaciones aumentadas de las Actas del Parlamento Europeo que cubren información sobre hablantes dialectales, y analizamos diferentes clases de inglés escrito que abarcan variedades nativas de las Islas Británicas. Nuestros análisis tienen como objetivo discutir las características discriminatorias entre las diferentes clases y revelar palabras cuyo uso difiere entre variedades del mismo idioma. Realizamos experimentos de clasificación y mostramos que es posible distinguir automáticamente entre las variedades dialectales con alta precisión, incluso después de la traducción, y proponemos un nuevo método de explicabilidad basado en alineaciones de incrustaciones para revelar diferencias específicas entre dialectos a nivel del vocabulario.
Descripción
En este documento, pretendemos explorar el grado en que los textos traducidos preservan las características lingüísticas de las variedades dialectales. Publicamos un conjunto de datos de anotaciones aumentadas de las Actas del Parlamento Europeo que cubren información sobre hablantes dialectales, y analizamos diferentes clases de inglés escrito que abarcan variedades nativas de las Islas Británicas. Nuestros análisis tienen como objetivo discutir las características discriminatorias entre las diferentes clases y revelar palabras cuyo uso difiere entre variedades del mismo idioma. Realizamos experimentos de clasificación y mostramos que es posible distinguir automáticamente entre las variedades dialectales con alta precisión, incluso después de la traducción, y proponemos un nuevo método de explicabilidad basado en alineaciones de incrustaciones para revelar diferencias específicas entre dialectos a nivel del vocabulario.