Minería de Datos Genealógicos de Archivos Históricos: El Caso de la Comunidad Judía en Pisa
Autores: Lo Duca, Angelica; Marchetti, Andrea; Moretti, Manuela; Diana, Francesca; Toniazzi, Mafalda; D"Errico, Andrea
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Minería de Datos Genealógicos de Archivos Históricos: El Caso de la Comunidad Judía en Pisa
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Comunidad judía
Archivo
Documentos
Información genealógica
Extracción
Documentos históricos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El archivo de la comunidad judía en Pisa posee una vasta colección de documentos y manuscritos que datan de siglos atrás. Estos documentos contienen valiosa información genealógica, incluyendo registros de nacimientos, matrimonios y defunciones. Este trabajo tiene como objetivo describir los resultados preliminares del proyecto Archivio Storico della Comunita Ebraica di Pisa (ASCEPI), con un enfoque en la extracción de datos del documento del Registro de Nati, Morti e Ballottati (NMB) en el archivo. El Registro NMB contiene aproximadamente 1900 registros de nacimientos, defunciones y personas votadas dentro de la comunidad judía en Pisa. El estudio utiliza una línea de trabajo semiautomática de digitalización, transcripción y técnicas de Procesamiento de Lenguaje Natural (NLP) para extraer datos personales como nombres, apellidos, fechas de nacimiento y defunción, y nombres de los padres de cada registro. Los datos extraídos se utilizan luego para construir una base de conocimiento y un árbol genealógico para una familia representativa, Supino. Este estudio demuestra el potencial de utilizar técnicas de NLP y basadas en reglas para extraer información valiosa de documentos históricos y construir árboles genealógicos.
Descripción
El archivo de la comunidad judía en Pisa posee una vasta colección de documentos y manuscritos que datan de siglos atrás. Estos documentos contienen valiosa información genealógica, incluyendo registros de nacimientos, matrimonios y defunciones. Este trabajo tiene como objetivo describir los resultados preliminares del proyecto Archivio Storico della Comunita Ebraica di Pisa (ASCEPI), con un enfoque en la extracción de datos del documento del Registro de Nati, Morti e Ballottati (NMB) en el archivo. El Registro NMB contiene aproximadamente 1900 registros de nacimientos, defunciones y personas votadas dentro de la comunidad judía en Pisa. El estudio utiliza una línea de trabajo semiautomática de digitalización, transcripción y técnicas de Procesamiento de Lenguaje Natural (NLP) para extraer datos personales como nombres, apellidos, fechas de nacimiento y defunción, y nombres de los padres de cada registro. Los datos extraídos se utilizan luego para construir una base de conocimiento y un árbol genealógico para una familia representativa, Supino. Este estudio demuestra el potencial de utilizar técnicas de NLP y basadas en reglas para extraer información valiosa de documentos históricos y construir árboles genealógicos.