Un análisis de la binarización de documentos: técnicas principales, nuevos desafíos y tendencias
Autores: Yang, Zhengxian; Zuo, Shikai; Zhou, Yanxi; He, Jinlong; Shi, Jianwen
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un análisis de la binarización de documentos: técnicas principales, nuevos desafíos y tendencias
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Binarización de imágenes de documentos
Segmentación de texto
Imágenes de documentos degradados
Reconocimiento Óptico de Caracteres
Texto en primer plano
Fondo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 52
Citaciones: Sin citaciones
La binarización de imágenes de documentos es una tarea desafiante, especialmente cuando se trata de la segmentación de texto en imágenes de documentos degradados. La binarización, como paso de preprocesamiento del Reconocimiento Óptico de Caracteres (OCR), es uno de los métodos de segmentación más fundamentales y comúnmente utilizados. Separa el texto del primer plano del fondo de la imagen del documento para facilitar el procesamiento de imágenes posterior. Dada la variedad de grados de degradación de las imágenes de documentos, los investigadores han propuesto una variedad de soluciones. En este documento, hemos resumido algunos desafíos y dificultades en el campo de la binarización de imágenes de documentos. Se mencionan aproximadamente 60 métodos de técnicas de binarización de imágenes de documentos, incluidos algoritmos tradicionales y algoritmos basados en aprendizaje profundo. Aquí, evaluamos el rendimiento de 25 técnicas de binarización de imágenes en el conjunto de datos H-DIBCO2016 para proporcionar ayuda para futuras investigaciones.
Descripción
La binarización de imágenes de documentos es una tarea desafiante, especialmente cuando se trata de la segmentación de texto en imágenes de documentos degradados. La binarización, como paso de preprocesamiento del Reconocimiento Óptico de Caracteres (OCR), es uno de los métodos de segmentación más fundamentales y comúnmente utilizados. Separa el texto del primer plano del fondo de la imagen del documento para facilitar el procesamiento de imágenes posterior. Dada la variedad de grados de degradación de las imágenes de documentos, los investigadores han propuesto una variedad de soluciones. En este documento, hemos resumido algunos desafíos y dificultades en el campo de la binarización de imágenes de documentos. Se mencionan aproximadamente 60 métodos de técnicas de binarización de imágenes de documentos, incluidos algoritmos tradicionales y algoritmos basados en aprendizaje profundo. Aquí, evaluamos el rendimiento de 25 técnicas de binarización de imágenes en el conjunto de datos H-DIBCO2016 para proporcionar ayuda para futuras investigaciones.