Reconocimiento del diseño de nivel de línea de documentos históricos con conocimiento de fondo
Autores: Fischer, Norbert; Hartelt, Alexander; Puppe, Frank
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reconocimiento del diseño de nivel de línea de documentos históricos con conocimiento de fondo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Digitalización
Transcripción
Documentos históricos
Aprendizaje profundo
Reconocimiento de diseño
Reconocimiento óptico de caracteres
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La digitalización y transcripción de documentos históricos ofrecen nuevas oportunidades de investigación para los humanistas y son los temas de muchos proyectos de edición. Sin embargo, todavía se requiere trabajo manual para las principales fases de reconocimiento de diseño y el posterior reconocimiento óptico de caracteres (OCR) de documentos impresos antiguos. Este artículo describe y evalúa cómo los enfoques de aprendizaje profundo reconocen líneas de texto y pueden ser extendidos al reconocimiento de diseño utilizando conocimientos previos. La evaluación se realizó en cinco corpus de impresiones antiguas de los siglos XV y XVI, que representan una variedad de características de diseño. Mientras que el texto principal con diseños estándar podría ser reconocido en el orden de lectura correcto con una precisión y recuperación de hasta el 99.9%, también se reconocieron diseños complejos a una tasa tan alta como el 90% utilizando conocimientos previos, cuyo potencial completo se reveló si se transcribían muchas páginas de la misma fuente.
Descripción
La digitalización y transcripción de documentos históricos ofrecen nuevas oportunidades de investigación para los humanistas y son los temas de muchos proyectos de edición. Sin embargo, todavía se requiere trabajo manual para las principales fases de reconocimiento de diseño y el posterior reconocimiento óptico de caracteres (OCR) de documentos impresos antiguos. Este artículo describe y evalúa cómo los enfoques de aprendizaje profundo reconocen líneas de texto y pueden ser extendidos al reconocimiento de diseño utilizando conocimientos previos. La evaluación se realizó en cinco corpus de impresiones antiguas de los siglos XV y XVI, que representan una variedad de características de diseño. Mientras que el texto principal con diseños estándar podría ser reconocido en el orden de lectura correcto con una precisión y recuperación de hasta el 99.9%, también se reconocieron diseños complejos a una tasa tan alta como el 90% utilizando conocimientos previos, cuyo potencial completo se reveló si se transcribían muchas páginas de la misma fuente.