Trig: reconocedor de texto basado en transformador con orientación de incrustación inicial
Autores: Tao, Yue; Jia, Zhiwei; Ma, Runze; Xu, Shugong
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Trig: reconocedor de texto basado en transformador con orientación de incrustación inicial
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reconocimiento de texto
Transformador
CNN
Módulo de modelado de contexto
Dependencias globales
Incrustación inicial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
El reconocimiento de texto en escenas (STR) es un puente importante entre imágenes y texto, atrayendo abundante atención en la investigación. Aunque las redes neuronales convolucionales (CNN) han logrado un progreso notable en esta tarea, la mayoría de los trabajos existentes necesitan un módulo adicional (módulo de modelado de contexto) para ayudar a la CNN a capturar dependencias globales y resolver el sesgo inductivo, fortaleciendo la relación entre las características del texto.
Descripción
El reconocimiento de texto en escenas (STR) es un puente importante entre imágenes y texto, atrayendo abundante atención en la investigación. Aunque las redes neuronales convolucionales (CNN) han logrado un progreso notable en esta tarea, la mayoría de los trabajos existentes necesitan un módulo adicional (módulo de modelado de contexto) para ayudar a la CNN a capturar dependencias globales y resolver el sesgo inductivo, fortaleciendo la relación entre las características del texto.