OntoDup: Coincidencia de Entidades Consciente de la Gobernanza para la Deducción de Gráficos de Conocimiento Académico
Autores: Galán-Mena, Jorge; López-Nores, Martín; Pulla-Sánchez, Daniel; Guerrero-Vásquez, Luis Fernando; Salgado-Guerrero, Juan Pablo
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
OntoDup: Coincidencia de Entidades Consciente de la Gobernanza para la Deducción de Gráficos de Conocimiento Académico
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Gráficas de conocimiento
Enfoque basado en ontologías
Coincidencia de entidades
Estado de gobernanza
Metadatos operativos
Enlaces de identidad consumibles
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los gráficos de conocimiento académico integran registros bibliográficos de fuentes heterogéneas y, por lo tanto, requieren una deduplicación controlada y auditable. Este documento presenta OntoDup, un enfoque impulsado por ontologías que modela la coincidencia de entidades como un proceso de decisión gobernado: los resultados de coincidencia se registran como afirmaciones reificadas enriquecidas con estado de gobernanza, evidencia, procedencia y metadatos operativos, mientras que una vista operativa separada se expone a través de la materialización impulsada por políticas de enlaces de identidad consumibles. Evaluamos OntoDup en los benchmarks DBLP-ACM y DBLP-Scholar bajo dos regímenes: (i) un entorno pre-bloqueado utilizando las listas de candidatos del benchmark para comparar métodos de coincidencia bajo un conjunto de candidatos fijo, y (ii) un entorno de extremo a extremo que genera candidatos a partir del gráfico con DeepBlocker y aplica triage y materialización gobernados. Informamos sobre la precisión/recall/F1 operativa calculada directamente en el gráfico a través de agregaciones SPARQL, caracterizamos la carga de trabajo de gobernanza a través de distribuciones de estado y cuantificamos el costo de inferencia para emparejadores basados en LLM a través de metadatos de tokens y latencia adjuntos a las afirmaciones. Para la evaluación de extremo a extremo, anclamos enlaces operativos contra una referencia positiva completa codificada como validaciones idealizadas derivadas de las etiquetas del benchmark, lo que permite el análisis de positivos perdidos en términos de estado de gobernanza y política de materialización. Los experimentos muestran que OntoDup permite la evaluación a nivel de enlaces de identidad consumibles, carga de trabajo de revisión y costo de inferencia, revelando compensaciones operativas que no son visibles solo a partir de métricas de coincidencia por pares.
Descripción
Los gráficos de conocimiento académico integran registros bibliográficos de fuentes heterogéneas y, por lo tanto, requieren una deduplicación controlada y auditable. Este documento presenta OntoDup, un enfoque impulsado por ontologías que modela la coincidencia de entidades como un proceso de decisión gobernado: los resultados de coincidencia se registran como afirmaciones reificadas enriquecidas con estado de gobernanza, evidencia, procedencia y metadatos operativos, mientras que una vista operativa separada se expone a través de la materialización impulsada por políticas de enlaces de identidad consumibles. Evaluamos OntoDup en los benchmarks DBLP-ACM y DBLP-Scholar bajo dos regímenes: (i) un entorno pre-bloqueado utilizando las listas de candidatos del benchmark para comparar métodos de coincidencia bajo un conjunto de candidatos fijo, y (ii) un entorno de extremo a extremo que genera candidatos a partir del gráfico con DeepBlocker y aplica triage y materialización gobernados. Informamos sobre la precisión/recall/F1 operativa calculada directamente en el gráfico a través de agregaciones SPARQL, caracterizamos la carga de trabajo de gobernanza a través de distribuciones de estado y cuantificamos el costo de inferencia para emparejadores basados en LLM a través de metadatos de tokens y latencia adjuntos a las afirmaciones. Para la evaluación de extremo a extremo, anclamos enlaces operativos contra una referencia positiva completa codificada como validaciones idealizadas derivadas de las etiquetas del benchmark, lo que permite el análisis de positivos perdidos en términos de estado de gobernanza y política de materialización. Los experimentos muestran que OntoDup permite la evaluación a nivel de enlaces de identidad consumibles, carga de trabajo de revisión y costo de inferencia, revelando compensaciones operativas que no son visibles solo a partir de métricas de coincidencia por pares.