Semánticas Conexiones en las Oraciones Complejas para la Post-Edición de la Traducción Automática en el Idioma Kazajo
Autores: Turganbayeva, Aliya; Rakhimova, Diana; Karyukin, Vladislav; Karibayeva, Aidana; Turarbek, Asem
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Semánticas Conexiones en las Oraciones Complejas para la Post-Edición de la Traducción Automática en el Idioma Kazajo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Traducción automática
Estructuras gramaticales
Oraciones complejas
Idioma kazajo
Reglas
Rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los problemas de la traducción automática surgen constantemente. Mientras que las plataformas de traducción más avanzadas, como Google y Yandex, permiten traducciones de alta calidad de idiomas con estructuras gramaticales simples, los idiomas más ricos morfológicamente aún sufren con la traducción de oraciones complejas, y los servicios de traducción dejan muchos errores estructurales. Este estudio se centró en diseñar las reglas para las estructuras gramaticales de oraciones complejas en el idioma kazajo, que tiene una gramática difícil con muchas reglas. Primero, se observaron minuciosamente los tipos de oraciones complejas en el idioma kazajo utilizando plantillas de la biblioteca FuzzyWuzzy. Luego, se completó la corrección de oraciones complejas con corpora paralelos. Las oraciones fueron traducidas al inglés y al ruso por sistemas de traducción automática existentes. Por lo tanto, se consideró la gramática de los pares de idiomas kazajo-inglés y kazajo-ruso. Ambos utilizaron las reglas diseñadas específicamente para los pasos de post-edición. Finalmente, se evaluó el rendimiento del algoritmo desarrollado para obtener una puntuación de precisión para cada par de idiomas. Este enfoque se propuso luego para su uso en la generación de otros corpora, post-edición y sistemas de análisis en trabajos futuros.
Descripción
Los problemas de la traducción automática surgen constantemente. Mientras que las plataformas de traducción más avanzadas, como Google y Yandex, permiten traducciones de alta calidad de idiomas con estructuras gramaticales simples, los idiomas más ricos morfológicamente aún sufren con la traducción de oraciones complejas, y los servicios de traducción dejan muchos errores estructurales. Este estudio se centró en diseñar las reglas para las estructuras gramaticales de oraciones complejas en el idioma kazajo, que tiene una gramática difícil con muchas reglas. Primero, se observaron minuciosamente los tipos de oraciones complejas en el idioma kazajo utilizando plantillas de la biblioteca FuzzyWuzzy. Luego, se completó la corrección de oraciones complejas con corpora paralelos. Las oraciones fueron traducidas al inglés y al ruso por sistemas de traducción automática existentes. Por lo tanto, se consideró la gramática de los pares de idiomas kazajo-inglés y kazajo-ruso. Ambos utilizaron las reglas diseñadas específicamente para los pasos de post-edición. Finalmente, se evaluó el rendimiento del algoritmo desarrollado para obtener una puntuación de precisión para cada par de idiomas. Este enfoque se propuso luego para su uso en la generación de otros corpora, post-edición y sistemas de análisis en trabajos futuros.