logo móvil
Contáctanos

Un análisis de la binarización de documentos: técnicas principales, nuevos desafíos y tendencias

Autores: Yang, Zhengxian; Zuo, Shikai; Zhou, Yanxi; He, Jinlong; Shi, Jianwen

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Un análisis de la binarización de documentos: técnicas principales, nuevos desafíos y tendencias


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Binarización de imágenes de documentos
Segmentación de texto
Imágenes de documentos degradados
Reconocimiento Óptico de Caracteres
Texto en primer plano
Fondo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 52

Citaciones: Sin citaciones


Descripción
La binarización de imágenes de documentos es una tarea desafiante, especialmente cuando se trata de la segmentación de texto en imágenes de documentos degradados. La binarización, como paso de preprocesamiento del Reconocimiento Óptico de Caracteres (OCR), es uno de los métodos de segmentación más fundamentales y comúnmente utilizados. Separa el texto del primer plano del fondo de la imagen del documento para facilitar el procesamiento de imágenes posterior. Dada la variedad de grados de degradación de las imágenes de documentos, los investigadores han propuesto una variedad de soluciones. En este documento, hemos resumido algunos desafíos y dificultades en el campo de la binarización de imágenes de documentos. Se mencionan aproximadamente 60 métodos de técnicas de binarización de imágenes de documentos, incluidos algoritmos tradicionales y algoritmos basados en aprendizaje profundo. Aquí, evaluamos el rendimiento de 25 técnicas de binarización de imágenes en el conjunto de datos H-DIBCO2016 para proporcionar ayuda para futuras investigaciones.

Otros recursos que podrían interesarte

Temas Virtualpro