logo móvil
Contáctanos

Modelos de datos matemáticos y características basadas en contexto para mejorar manuscritos históricos degradados utilizando clasificación de redes neuronales

Autores: Savino, Pasquale; Tonazzini, Anna

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Modelos de datos matemáticos y características basadas en contexto para mejorar manuscritos históricos degradados utilizando clasificación de redes neuronales


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Manuscritos históricos
Transparencia de tinta
Redes neuronales
Análisis de texto
Incertidumbres de clasificación
Información de contexto de píxeles

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones


Descripción
Una causa común de deterioro en manuscritos históricos es la transparencia de la tinta o el sangrado de la página opuesta. Los filólogos y paleógrafos pueden beneficiarse significativamente al minimizar estas interferencias al intentar descifrar el texto original. Además, el análisis de texto asistido por computadora también puede beneficiarse de dicha mejora del texto. En trabajos anteriores, propusimos el uso de redes neuronales (NN) en combinación con un modelo de datos que caracteriza el daño cuando ambos lados de una página han sido digitalizados. Este enfoque ofrece la ventaja distintiva de permitir la creación de un conjunto de entrenamiento artificial que enseña a la NN a diferenciar entre píxeles limpios y dañados. Probamos este concepto utilizando una red neuronal superficial, que resultó efectiva en la categorización de textos con diferentes niveles de deterioro. En este estudio, adaptamos el diseño de la NN para abordar las incertidumbres de clasificación restantes causadas por áreas de superposición de texto, inhomogeneidad y picos de degradación. Específicamente, introducimos una nueva clase de salida para los píxeles dentro de áreas de texto superpuestas e incorporamos características adicionales relacionadas con la información de contexto del píxel para promover la misma clasificación para píxeles adyacentes entre sí. Nuestros experimentos demuestran que estas mejoras mejoran significativamente la precisión de la clasificación. Esta mejora es evidente en la calidad tanto de la binarización, que ayuda en el análisis de texto, como de la restauración virtual, destinada a recuperar la apariencia original del manuscrito. Las pruebas realizadas en un conjunto de datos público, utilizando índices de calidad estándar, revelan que el método propuesto supera tanto nuestras propuestas anteriores como otros métodos notables encontrados en la literatura.

Otros recursos que podrían interesarte

Temas Virtualpro