Traducción neural machine translation de ingeniería eléctrica basada en redes neuronales convolucionales integradas
Autores: Liu, Zikang; Chen, Yuan; Zhang, Juwei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Traducción neural machine translation de ingeniería eléctrica basada en redes neuronales convolucionales integradas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Traducción automática neuronal
Ingeniería eléctrica
Modelo Transformer
Extracción de características
Red neuronal convolucional
Puntuaciones BLEU
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
La investigación ha demostrado que la traducción automática neuronal tiene un rendimiento deficiente en corpus paralelos de baja cantidad de recursos y dominios específicos. En este documento, nos centramos en el problema de la traducción automática neuronal en el campo de la ingeniería eléctrica. Para abordar la mala traducción causada por la capacidad limitada del modelo Transformer para extraer información de características de ciertas oraciones, proponemos dos nuevos modelos que integran una red neuronal convolucional como capa de extracción de características en el modelo Transformer. La información de características extraída por la CNN se fusiona por separado en los modelos del lado de la fuente y del lado del objetivo, lo que mejora la capacidad del modelo Transformer para extraer información de características, optimiza el rendimiento del modelo y mejora la calidad de la traducción. En el conjunto de datos del campo de la ingeniería eléctrica, los modelos propuestos del lado de la fuente y del lado del objetivo mejoraron los puntajes BLEU en 1,63 y 1,12 puntos porcentuales, respectivamente, en comparación con el modelo base. Además, los dos modelos propuestos en este documento pueden aprender conocimiento semántico rico sin depender de conocimientos auxiliares como el etiquetado de partes de la oración y el reconocimiento de entidades con nombre, lo que ahorra cierta cantidad de recursos humanos y costos de tiempo.
Descripción
La investigación ha demostrado que la traducción automática neuronal tiene un rendimiento deficiente en corpus paralelos de baja cantidad de recursos y dominios específicos. En este documento, nos centramos en el problema de la traducción automática neuronal en el campo de la ingeniería eléctrica. Para abordar la mala traducción causada por la capacidad limitada del modelo Transformer para extraer información de características de ciertas oraciones, proponemos dos nuevos modelos que integran una red neuronal convolucional como capa de extracción de características en el modelo Transformer. La información de características extraída por la CNN se fusiona por separado en los modelos del lado de la fuente y del lado del objetivo, lo que mejora la capacidad del modelo Transformer para extraer información de características, optimiza el rendimiento del modelo y mejora la calidad de la traducción. En el conjunto de datos del campo de la ingeniería eléctrica, los modelos propuestos del lado de la fuente y del lado del objetivo mejoraron los puntajes BLEU en 1,63 y 1,12 puntos porcentuales, respectivamente, en comparación con el modelo base. Además, los dos modelos propuestos en este documento pueden aprender conocimiento semántico rico sin depender de conocimientos auxiliares como el etiquetado de partes de la oración y el reconocimiento de entidades con nombre, lo que ahorra cierta cantidad de recursos humanos y costos de tiempo.