Redes Adversarias de Atención Visual para la Traducción de Fuentes Chinas
Autores: Li, Te; Yang, Fang; Song, Yao
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Redes Adversarias de Atención Visual para la Traducción de Fuentes Chinas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Muchos modelos de traducción de fuentes chinas
Componentes de caracteres
Anotación manual
Red generativa adversarial
Mejora de imágenes
Red adversarial de atención visual
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Actualmente, muchos modelos de traducción de fuentes chinas adoptan el método de dividir los componentes de los caracteres para mejorar la calidad de las imágenes de fuentes generadas. Sin embargo, los componentes de los caracteres requieren una gran cantidad de anotaciones manuales para descomponer los caracteres y determinar la composición de cada carácter como entrada para el entrenamiento. En este documento, establecemos un modelo de traducción de fuentes chinas basado en una red generativa adversaria sin descomposición. En primer lugar, mejoramos el método de mejora de imágenes para imágenes de caracteres chinos. Ayuda al modelo a aprender información de la estructura de los trazos de los caracteres chinos para generar imágenes de fuentes con trazos completos y precisos. En segundo lugar, proponemos una red adversaria de atención visual. Mediante el uso de un bloque de atención visual, la red captura características globales y locales para construir detalles de los caracteres. Los experimentos demuestran que nuestro método genera imágenes de caracteres chinos de alta calidad con una gran diversidad de estilos, incluidos caracteres caligráficos.
Descripción
Actualmente, muchos modelos de traducción de fuentes chinas adoptan el método de dividir los componentes de los caracteres para mejorar la calidad de las imágenes de fuentes generadas. Sin embargo, los componentes de los caracteres requieren una gran cantidad de anotaciones manuales para descomponer los caracteres y determinar la composición de cada carácter como entrada para el entrenamiento. En este documento, establecemos un modelo de traducción de fuentes chinas basado en una red generativa adversaria sin descomposición. En primer lugar, mejoramos el método de mejora de imágenes para imágenes de caracteres chinos. Ayuda al modelo a aprender información de la estructura de los trazos de los caracteres chinos para generar imágenes de fuentes con trazos completos y precisos. En segundo lugar, proponemos una red adversaria de atención visual. Mediante el uso de un bloque de atención visual, la red captura características globales y locales para construir detalles de los caracteres. Los experimentos demuestran que nuestro método genera imágenes de caracteres chinos de alta calidad con una gran diversidad de estilos, incluidos caracteres caligráficos.