Seatte: un modelo de inserción basado en la separación del espacio de atributos para completar grafos de conocimiento
Autores: Liang, Zongwei; Yang, Junan; Liu, Hui; Huang, Keju; Qu, Lingzhi; Cui, Lin; Li, Xiang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Seatte: un modelo de inserción basado en la separación del espacio de atributos para completar grafos de conocimiento
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Gráficos de conocimiento
Predicción de enlaces
Incrustación de gráficos de conocimiento
Modelos de descomposición de tensores
Separación de atributos
SeAttE
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Los grafos de conocimiento son representaciones estructuradas de hechos del mundo real. Sin embargo, típicamente contienen solo un pequeño subconjunto de todos los posibles hechos. La predicción de enlaces es la tarea de inferir hechos faltantes basados en los existentes. El modelado de grafos de conocimiento, que representa entidades y relaciones en los grafos de conocimiento con vectores de alta dimensión, ha logrado avances significativos en la predicción de enlaces. Los modelos de descomposición de tensores son una familia de modelos de incrustación con buen rendimiento en la predicción de enlaces. Los modelos anteriores de descomposición de tensores no consideran el problema de la separación de atributos. Estos modelos exploran principalmente regularizaciones particulares para mejorar el rendimiento. No importa cuán sofisticado sea el diseño de los modelos de descomposición de tensores, el rendimiento es teóricamente inferior al modelo básico de descomposición de tensores. Además, la tarea no detectada de separación de atributos en los modelos tradicionales se deja simplemente al entrenamiento. Sin embargo, la cantidad de parámetros para esta tarea es tremenda y el modelo es propenso al sobreajuste. Investigamos el diseño que se acerca al rendimiento teórico de los modelos de descomposición de tensores en este documento. La observación de que medir la racionalidad de triples específicos significa comparar el grado de coincidencia de los atributos específicos asociados con las relaciones es bien conocida. Por lo tanto, la comparación de triples reales necesita primero separar las dimensiones de atributos específicos, lo cual es ignorado por los modelos existentes. Inspirados por esta observación, diseñamos un modelo novedoso de descomposición de tensores basado en el espacio de atributos separados para la completitud de grafos de conocimiento (SeAttE). La novedad principal de este documento es que SeAttE es el primer modelo entre la familia de descomposición de tensores que considera la tarea de separación del espacio de atributos. Además, SeAttE transforma el aprendizaje de demasiados parámetros para la tarea de separación del espacio de atributos en el diseño de la estructura. Esta operación permite que el modelo se enfoque en aprender la equivalencia semántica entre las relaciones, lo que hace que el rendimiento se acerque al límite teórico. También demostramos que RESCAL, DisMult y ComplEx son casos especiales de SeAttE en este documento. Además, clasificamos los modelos existentes de descomposición de tensores para investigadores posteriores. Los experimentos en los conjuntos de datos de referencia muestran que SeAttE ha logrado el estado del arte entre los modelos de descomposición de tensores.
Descripción
Los grafos de conocimiento son representaciones estructuradas de hechos del mundo real. Sin embargo, típicamente contienen solo un pequeño subconjunto de todos los posibles hechos. La predicción de enlaces es la tarea de inferir hechos faltantes basados en los existentes. El modelado de grafos de conocimiento, que representa entidades y relaciones en los grafos de conocimiento con vectores de alta dimensión, ha logrado avances significativos en la predicción de enlaces. Los modelos de descomposición de tensores son una familia de modelos de incrustación con buen rendimiento en la predicción de enlaces. Los modelos anteriores de descomposición de tensores no consideran el problema de la separación de atributos. Estos modelos exploran principalmente regularizaciones particulares para mejorar el rendimiento. No importa cuán sofisticado sea el diseño de los modelos de descomposición de tensores, el rendimiento es teóricamente inferior al modelo básico de descomposición de tensores. Además, la tarea no detectada de separación de atributos en los modelos tradicionales se deja simplemente al entrenamiento. Sin embargo, la cantidad de parámetros para esta tarea es tremenda y el modelo es propenso al sobreajuste. Investigamos el diseño que se acerca al rendimiento teórico de los modelos de descomposición de tensores en este documento. La observación de que medir la racionalidad de triples específicos significa comparar el grado de coincidencia de los atributos específicos asociados con las relaciones es bien conocida. Por lo tanto, la comparación de triples reales necesita primero separar las dimensiones de atributos específicos, lo cual es ignorado por los modelos existentes. Inspirados por esta observación, diseñamos un modelo novedoso de descomposición de tensores basado en el espacio de atributos separados para la completitud de grafos de conocimiento (SeAttE). La novedad principal de este documento es que SeAttE es el primer modelo entre la familia de descomposición de tensores que considera la tarea de separación del espacio de atributos. Además, SeAttE transforma el aprendizaje de demasiados parámetros para la tarea de separación del espacio de atributos en el diseño de la estructura. Esta operación permite que el modelo se enfoque en aprender la equivalencia semántica entre las relaciones, lo que hace que el rendimiento se acerque al límite teórico. También demostramos que RESCAL, DisMult y ComplEx son casos especiales de SeAttE en este documento. Además, clasificamos los modelos existentes de descomposición de tensores para investigadores posteriores. Los experimentos en los conjuntos de datos de referencia muestran que SeAttE ha logrado el estado del arte entre los modelos de descomposición de tensores.