Modelos de datos matemáticos y características basadas en contexto para mejorar manuscritos históricos degradados utilizando clasificación de redes neuronales

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Modelos de datos matemáticos y características basadas en contexto para mejorar manuscritos históricos degradados utilizando clasificación de redes neuronales

Autores: Savino, Pasquale; Tonazzini, Anna

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Modelos de datos matemáticos y características basadas en contexto para mejorar manuscritos históricos degradados utilizando clasificación de redes neuronales

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Manuscritos históricos

Transparencia de tinta

Redes neuronales

Análisis de texto

Incertidumbres de clasificación

Información de contexto de píxeles

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones

Una causa común de deterioro en manuscritos históricos es la transparencia de la tinta o el sangrado de la página opuesta. Los filólogos y paleógrafos pueden beneficiarse significativamente al minimizar estas interferencias al intentar descifrar el texto original. Además, el análisis de texto asistido por computadora también puede beneficiarse de dicha mejora del texto. En trabajos anteriores, propusimos el uso de redes neuronales (NN) en combinación con un modelo de datos que caracteriza el daño cuando ambos lados de una página han sido digitalizados. Este enfoque ofrece la ventaja distintiva de permitir la creación de un conjunto de entrenamiento artificial que enseña a la NN a diferenciar entre píxeles limpios y dañados. Probamos este concepto utilizando una red neuronal superficial, que resultó efectiva en la categorización de textos con diferentes niveles de deterioro. En este estudio, adaptamos el diseño de la NN para abordar las incertidumbres de clasificación restantes causadas por áreas de superposición de texto, inhomogeneidad y picos de degradación. Específicamente, introducimos una nueva clase de salida para los píxeles dentro de áreas de texto superpuestas e incorporamos características adicionales relacionadas con la información de contexto del píxel para promover la misma clasificación para píxeles adyacentes entre sí. Nuestros experimentos demuestran que estas mejoras mejoran significativamente la precisión de la clasificación. Esta mejora es evidente en la calidad tanto de la binarización, que ayuda en el análisis de texto, como de la restauración virtual, destinada a recuperar la apariencia original del manuscrito. Las pruebas realizadas en un conjunto de datos público, utilizando índices de calidad estándar, revelan que el método propuesto supera tanto nuestras propuestas anteriores como otros métodos notables encontrados en la literatura.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro