Segmentación de jeroglíficos egipcios con redes neuronales convolucionales
Autores: Guidi, Tommaso; Python, Lorenzo; Forasassi, Matteo; Cucci, Costanza; Franci, Massimiliano; Argenti, Fabrizio; Barucci, Andrea
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Segmentación de jeroglíficos egipcios con redes neuronales convolucionales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Algoritmo de aprendizaje profundo
Jeroglíficos egipcios antiguos
Segmentación
Instancias de imagen
Conjunto de datos
Estudios de aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
El objetivo de este trabajo es mostrar la aplicación de un algoritmo de Deep Learning capaz de operar la segmentación de jeroglíficos egipcios antiguos presentes en una imagen, con la ambición de ser lo más versátil posible a pesar de la variabilidad de la fuente de la imagen. El problema es bastante complejo, siendo los principales obstáculos la considerable cantidad de diferentes clases de jeroglíficos existentes, las diferencias relacionadas con la mano del escriba, así como las grandes diferencias entre los diversos soportes, como papiros, piedra o madera, donde están escritos. Además, como en todos los hallazgos arqueológicos, los daños en los soportes son frecuentes, con la consecuencia de que los jeroglíficos pueden estar parcialmente corruptos. Para hacer frente a este desafiante problema, aprovechamos la plataforma bien conocida Detectron2, desarrollada por el Grupo de Investigación en Inteligencia Artificial de Facebook, centrándonos en la arquitectura Mask R-CNN para realizar la segmentación de instancias de imágenes. Asimismo, para varios estudios de aprendizaje automático, uno de los desafíos más difíciles es la creación de un conjunto de datos adecuado. En este documento, describiremos un conjunto de datos de jeroglíficos que se ha creado con el propósito de la segmentación, destacando sus pros y contras, y el impacto de diferentes hiperparámetros en los resultados finales. También se presentarán y discutirán pruebas sobre la segmentación de imágenes tomadas de bases de datos públicas, junto con las limitaciones de nuestro estudio.
Descripción
El objetivo de este trabajo es mostrar la aplicación de un algoritmo de Deep Learning capaz de operar la segmentación de jeroglíficos egipcios antiguos presentes en una imagen, con la ambición de ser lo más versátil posible a pesar de la variabilidad de la fuente de la imagen. El problema es bastante complejo, siendo los principales obstáculos la considerable cantidad de diferentes clases de jeroglíficos existentes, las diferencias relacionadas con la mano del escriba, así como las grandes diferencias entre los diversos soportes, como papiros, piedra o madera, donde están escritos. Además, como en todos los hallazgos arqueológicos, los daños en los soportes son frecuentes, con la consecuencia de que los jeroglíficos pueden estar parcialmente corruptos. Para hacer frente a este desafiante problema, aprovechamos la plataforma bien conocida Detectron2, desarrollada por el Grupo de Investigación en Inteligencia Artificial de Facebook, centrándonos en la arquitectura Mask R-CNN para realizar la segmentación de instancias de imágenes. Asimismo, para varios estudios de aprendizaje automático, uno de los desafíos más difíciles es la creación de un conjunto de datos adecuado. En este documento, describiremos un conjunto de datos de jeroglíficos que se ha creado con el propósito de la segmentación, destacando sus pros y contras, y el impacto de diferentes hiperparámetros en los resultados finales. También se presentarán y discutirán pruebas sobre la segmentación de imágenes tomadas de bases de datos públicas, junto con las limitaciones de nuestro estudio.