CIDOC2VEC: Extrayendo Información de Gráficas de Conocimiento Humanístico Atomizadas de CIDOC-CRM
Autores: El-Hajj, Hassan; Valleriani, Matteo
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
CIDOC2VEC: Extrayendo Información de Gráficas de Conocimiento Humanístico Atomizadas de CIDOC-CRM
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Desarrollo
Humanidades digitales
Grafos de conocimiento
Ontología CIDOC-CRM
Entidades
Incrustaciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El desarrollo del campo de las humanidades digitales en los últimos años ha llevado al aumento del uso de grafos de conocimiento dentro de la comunidad. Muchos proyectos de humanidades digitales tienden a modelar sus datos basándose en la ontología CIDOC-CRM, que ofrece una amplia variedad de clases apropiadas para almacenar datos de humanidades y patrimonio cultural. El modelo de ontología CIDOC-CRM conduce a una estructura de grafo de conocimiento en la que muchas entidades a menudo están vinculadas entre sí a través de cadenas de relaciones, lo que significa que la información relevante a menudo se encuentra a muchos saltos de distancia de sus entidades. En este artículo, presentamos un método basado en recorridos de grafos y procesamiento de texto para extraer información de entidades y proporcionar incrustaciones semánticamente relevantes. En el proceso, pudimos generar recomendaciones de similitud así como explorar su estructura de datos subyacente. Este enfoque se demostró luego en el Conjunto de Datos Sphaera, que fue modelado de acuerdo con la estructura de datos CIDOC-CRM.
Descripción
El desarrollo del campo de las humanidades digitales en los últimos años ha llevado al aumento del uso de grafos de conocimiento dentro de la comunidad. Muchos proyectos de humanidades digitales tienden a modelar sus datos basándose en la ontología CIDOC-CRM, que ofrece una amplia variedad de clases apropiadas para almacenar datos de humanidades y patrimonio cultural. El modelo de ontología CIDOC-CRM conduce a una estructura de grafo de conocimiento en la que muchas entidades a menudo están vinculadas entre sí a través de cadenas de relaciones, lo que significa que la información relevante a menudo se encuentra a muchos saltos de distancia de sus entidades. En este artículo, presentamos un método basado en recorridos de grafos y procesamiento de texto para extraer información de entidades y proporcionar incrustaciones semánticamente relevantes. En el proceso, pudimos generar recomendaciones de similitud así como explorar su estructura de datos subyacente. Este enfoque se demostró luego en el Conjunto de Datos Sphaera, que fue modelado de acuerdo con la estructura de datos CIDOC-CRM.