Reconocimiento de Texto en Escenas Basado en CRNN Mejorado
Autores: Yu, Wenhua; Ibrayim, Mayire; Hamdulla, Askar
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reconocimiento de Texto en Escenas Basado en CRNN Mejorado
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reconocimiento de texto
Visión por computadora
Texto en escenas
Adquisición de imágenes
Modelo CRNN
Texto irregular
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El reconocimiento de texto es un tema de investigación importante en la visión por computadora. El texto en escena, que se refiere al texto en escenas reales, a veces necesita cumplir con el requisito de atraer la atención, y hay situaciones como la deformación. Al mismo tiempo, el proceso de adquisición de imágenes se ve afectado por factores como la oclusión, el ruido y la obstrucción, lo que hace que las tareas de reconocimiento de texto en escena sean más desafiantes. En este artículo, mejoramos el modelo CRNN para el reconocimiento de texto, que tiene una precisión relativamente baja, un rendimiento deficiente en el reconocimiento de texto irregular y solo considera la obtención de información de secuencia de texto desde un solo aspecto, lo que resulta en una adquisición de información incompleta. En primer lugar, para abordar los problemas de baja precisión en el reconocimiento de texto y el mal reconocimiento de texto irregular, añadimos suavizado de etiquetas para garantizar la capacidad de generalización del modelo. Luego, introducimos la función de pérdida de suavizado del reconocimiento de voz en el campo del reconocimiento de texto y añadimos un modelo de lenguaje para aumentar los canales de adquisición de información, logrando en última instancia el objetivo de mejorar la precisión del reconocimiento de texto. Este método fue verificado experimentalmente en seis conjuntos de datos públicos y comparado con otros métodos avanzados. Los resultados experimentales muestran que este método tiene un buen rendimiento en la mayoría de las pruebas de referencia, y el modelo mejorado supera al modelo original en rendimiento de reconocimiento.
Descripción
El reconocimiento de texto es un tema de investigación importante en la visión por computadora. El texto en escena, que se refiere al texto en escenas reales, a veces necesita cumplir con el requisito de atraer la atención, y hay situaciones como la deformación. Al mismo tiempo, el proceso de adquisición de imágenes se ve afectado por factores como la oclusión, el ruido y la obstrucción, lo que hace que las tareas de reconocimiento de texto en escena sean más desafiantes. En este artículo, mejoramos el modelo CRNN para el reconocimiento de texto, que tiene una precisión relativamente baja, un rendimiento deficiente en el reconocimiento de texto irregular y solo considera la obtención de información de secuencia de texto desde un solo aspecto, lo que resulta en una adquisición de información incompleta. En primer lugar, para abordar los problemas de baja precisión en el reconocimiento de texto y el mal reconocimiento de texto irregular, añadimos suavizado de etiquetas para garantizar la capacidad de generalización del modelo. Luego, introducimos la función de pérdida de suavizado del reconocimiento de voz en el campo del reconocimiento de texto y añadimos un modelo de lenguaje para aumentar los canales de adquisición de información, logrando en última instancia el objetivo de mejorar la precisión del reconocimiento de texto. Este método fue verificado experimentalmente en seis conjuntos de datos públicos y comparado con otros métodos avanzados. Los resultados experimentales muestran que este método tiene un buen rendimiento en la mayoría de las pruebas de referencia, y el modelo mejorado supera al modelo original en rendimiento de reconocimiento.