logo móvil
Contáctanos

Traducción neural machine translation de ingeniería eléctrica basada en redes neuronales convolucionales integradas

Autores: Liu, Zikang; Chen, Yuan; Zhang, Juwei

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Traducción neural machine translation de ingeniería eléctrica basada en redes neuronales convolucionales integradas


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Traducción automática neuronal
Ingeniería eléctrica
Modelo Transformer
Extracción de características
Red neuronal convolucional
Puntuaciones BLEU

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 41

Citaciones: Sin citaciones


Descripción
La investigación ha demostrado que la traducción automática neuronal tiene un rendimiento deficiente en corpus paralelos de baja cantidad de recursos y dominios específicos. En este documento, nos centramos en el problema de la traducción automática neuronal en el campo de la ingeniería eléctrica. Para abordar la mala traducción causada por la capacidad limitada del modelo Transformer para extraer información de características de ciertas oraciones, proponemos dos nuevos modelos que integran una red neuronal convolucional como capa de extracción de características en el modelo Transformer. La información de características extraída por la CNN se fusiona por separado en los modelos del lado de la fuente y del lado del objetivo, lo que mejora la capacidad del modelo Transformer para extraer información de características, optimiza el rendimiento del modelo y mejora la calidad de la traducción. En el conjunto de datos del campo de la ingeniería eléctrica, los modelos propuestos del lado de la fuente y del lado del objetivo mejoraron los puntajes BLEU en 1,63 y 1,12 puntos porcentuales, respectivamente, en comparación con el modelo base. Además, los dos modelos propuestos en este documento pueden aprender conocimiento semántico rico sin depender de conocimientos auxiliares como el etiquetado de partes de la oración y el reconocimiento de entidades con nombre, lo que ahorra cierta cantidad de recursos humanos y costos de tiempo.

Otros recursos que podrían interesarte

Temas Virtualpro