Fusion de incrustaciones de caracteres de atributo con muestreo negativo truncado para alineación de entidades
Autores: Li, Hongchan; Zhu, Zhuang; Zhu, Haodong; Jin, Baohua
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Fusion de incrustaciones de caracteres de atributo con muestreo negativo truncado para alineación de entidades
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Encontrar
Pares
Entidades
Grafos de conocimiento
Alineación de entidades
Muestreo negativo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Encontrar pares de entidades de dos grafos de conocimiento diferentes que reflejen el mismo objeto del mundo real es el propósito del alineamiento de entidades para grafos de conocimiento. En los últimos años, las técnicas que utilizan el alineamiento de entidades para la fusión de conocimiento han recibido una amplia atención. En este artículo, sugerimos un método para el alineamiento de entidades utilizando muestreo negativo truncado con incrustación de caracteres de atributo. El método principalmente hace uso de los datos de relación y atributo en grafos de conocimiento heterogéneos para cumplir la tarea de alineamiento de entidades. Primero, el marco utiliza el mapeo de relaciones para unificar el espacio de nombres de relaciones heterogéneas. En segundo lugar, las incrustaciones de caracteres de atributo se generan utilizando los triples de atributo en el grafo de conocimiento para unificar el espacio de incrustación de entidades heterogéneas. Luego, la similitud de entidades entre grafos de conocimiento heterogéneos se captura mediante la incrustación estructural. A continuación, para aprender información semántica más útil durante el muestreo negativo, el marco adopta una estrategia de muestreo negativo truncado para aumentar la generalización del modelo. El procedimiento de muestreo negativo emplea objetivos con alta similitud al objetivo de la entidad como objetivos de muestra negativos. Finalmente, realizamos pruebas de comparación en dos conjuntos de datos del mundo real conocidos, y los resultados demuestran que el modelo propuesto supera a otros tres enfoques avanzados representativos, especialmente con una mejora de más del 10% en la métrica Hits@k en comparación con el método base.
Descripción
Encontrar pares de entidades de dos grafos de conocimiento diferentes que reflejen el mismo objeto del mundo real es el propósito del alineamiento de entidades para grafos de conocimiento. En los últimos años, las técnicas que utilizan el alineamiento de entidades para la fusión de conocimiento han recibido una amplia atención. En este artículo, sugerimos un método para el alineamiento de entidades utilizando muestreo negativo truncado con incrustación de caracteres de atributo. El método principalmente hace uso de los datos de relación y atributo en grafos de conocimiento heterogéneos para cumplir la tarea de alineamiento de entidades. Primero, el marco utiliza el mapeo de relaciones para unificar el espacio de nombres de relaciones heterogéneas. En segundo lugar, las incrustaciones de caracteres de atributo se generan utilizando los triples de atributo en el grafo de conocimiento para unificar el espacio de incrustación de entidades heterogéneas. Luego, la similitud de entidades entre grafos de conocimiento heterogéneos se captura mediante la incrustación estructural. A continuación, para aprender información semántica más útil durante el muestreo negativo, el marco adopta una estrategia de muestreo negativo truncado para aumentar la generalización del modelo. El procedimiento de muestreo negativo emplea objetivos con alta similitud al objetivo de la entidad como objetivos de muestra negativos. Finalmente, realizamos pruebas de comparación en dos conjuntos de datos del mundo real conocidos, y los resultados demuestran que el modelo propuesto supera a otros tres enfoques avanzados representativos, especialmente con una mejora de más del 10% en la métrica Hits@k en comparación con el método base.