Estudio sobre la minería de traducción de términos desconocidos a partir de fragmentos de Google
Autores: Li, Bin; Yao, Jianmin
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Estudio sobre la minería de traducción de términos desconocidos a partir de fragmentos de Google
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Páginas web bilingües
Traducciones
Límites léxicos
Información de co-ocurrencia
Corpora bilingües
Medición del cambio de frecuencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las páginas web bilingües se utilizan ampliamente para extraer traducciones de términos desconocidos. Este estudio se centró en una solución efectiva para obtener páginas web relevantes, extraer traducciones con límites léxicos correctos y clasificar los candidatos a traducción. Esta investigación adoptó información de coocurrencia para obtener los términos temáticos y luego amplió la consulta fuente con la traducción de los términos temáticos para recopilar fragmentos efectivos de motores de búsqueda bilingües. Posteriormente, se extrajeron candidatos válidos de corpora bilingües pequeños y ruidosos utilizando una medición de cambio de frecuencia mejorada que combina información adyacente. Esta investigación desarrolló un método que considera patrones superficiales, frecuencia-distancia y características fonéticas para elegir una traducción apropiada. Los resultados experimentales revelaron que el método propuesto funcionó notablemente bien para extraer traducciones de términos desconocidos.
Descripción
Las páginas web bilingües se utilizan ampliamente para extraer traducciones de términos desconocidos. Este estudio se centró en una solución efectiva para obtener páginas web relevantes, extraer traducciones con límites léxicos correctos y clasificar los candidatos a traducción. Esta investigación adoptó información de coocurrencia para obtener los términos temáticos y luego amplió la consulta fuente con la traducción de los términos temáticos para recopilar fragmentos efectivos de motores de búsqueda bilingües. Posteriormente, se extrajeron candidatos válidos de corpora bilingües pequeños y ruidosos utilizando una medición de cambio de frecuencia mejorada que combina información adyacente. Esta investigación desarrolló un método que considera patrones superficiales, frecuencia-distancia y características fonéticas para elegir una traducción apropiada. Los resultados experimentales revelaron que el método propuesto funcionó notablemente bien para extraer traducciones de términos desconocidos.