Un método efectivo para la detección y reconocimiento de textos uigures en imágenes con fondos
Autores: Ibrayim, Mayire; Mattohti, Ahmatjan; Hamdulla, Askar
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un método efectivo para la detección y reconocimiento de textos uigures en imágenes con fondos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Uyghur
Detección de texto
Reconocimiento
Imágenes
Clasificación cnn
Red crnn
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección y reconocimiento de texto uigur en imágenes con fondos simples sigue siendo una tarea desafiante para el análisis de contenido de imágenes uigures. En este artículo, proponemos un nuevo método efectivo de detección de texto uigur basado en MSERs mejorados por canal y el modelo de clasificación CNN. Con el fin de extraer componentes de texto más completos, se presenta un nuevo algoritmo de extracción de regiones candidatas de texto, que se basa en los MSERs mejorados por canal de acuerdo con las características del texto uigur. Para podar de manera efectiva las regiones no textuales, diseñamos una red de clasificación CNN basada en LeNet-5, que obtiene automáticamente las características descriptivas y evita el tedioso y poco eficiente trabajo de extracción de características manual. Para el reconocimiento de texto uigur en imágenes, mejoramos la red CRNN tradicional, y para verificar su efectividad, las redes se entrenaron en un conjunto de datos sintético y se evaluaron en los conjuntos de datos de reconocimiento de texto. Los resultados experimentales indicaron que el método de detección de texto uigur en este artículo es robusto y aplicable, y el resultado del reconocimiento por el CRNN mejorado fue mejor que el de la red CRNN original.
Descripción
La detección y reconocimiento de texto uigur en imágenes con fondos simples sigue siendo una tarea desafiante para el análisis de contenido de imágenes uigures. En este artículo, proponemos un nuevo método efectivo de detección de texto uigur basado en MSERs mejorados por canal y el modelo de clasificación CNN. Con el fin de extraer componentes de texto más completos, se presenta un nuevo algoritmo de extracción de regiones candidatas de texto, que se basa en los MSERs mejorados por canal de acuerdo con las características del texto uigur. Para podar de manera efectiva las regiones no textuales, diseñamos una red de clasificación CNN basada en LeNet-5, que obtiene automáticamente las características descriptivas y evita el tedioso y poco eficiente trabajo de extracción de características manual. Para el reconocimiento de texto uigur en imágenes, mejoramos la red CRNN tradicional, y para verificar su efectividad, las redes se entrenaron en un conjunto de datos sintético y se evaluaron en los conjuntos de datos de reconocimiento de texto. Los resultados experimentales indicaron que el método de detección de texto uigur en este artículo es robusto y aplicable, y el resultado del reconocimiento por el CRNN mejorado fue mejor que el de la red CRNN original.