Aprendiendo incrustación de gráficos heterogéneos con agregación basada en metapath para predicción de enlaces
Autores: Zhang, Chengdong; Li, Keke; Wang, Shaoqing; Zhou, Bin; Wang, Lei; Sun, Fuzhen
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendiendo incrustación de gráficos heterogéneos con agregación basada en metapath para predicción de enlaces
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Crecimiento
Redes neuronales gráficas
GNN basadas en metapath
Incrustaciones de gráficos heterogéneos
Representación de nodos
Predicción de enlaces
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
Junto con el crecimiento de las redes neuronales de grafos (GNNs), muchos investigadores han adoptado GNNs basadas en metapath para manejar la incrustación de grafos heterogéneos complejos. La definición convencional de un metapath solo distingue si hay una conexión entre nodos en el esquema de red, donde se ignora el tipo de borde. Esto conduce a una representación inexacta de nodos y posteriormente resulta en un rendimiento de predicción subóptimo. En grafos heterogéneos, un nodo puede estar conectado por múltiples tipos de bordes. De hecho, cada tipo de borde representa un tipo de escena. La intuición es que si la incrustación de nodos se entrena bajo diferentes escenas, la representación completa de nodos se puede obtener combinándolos orgánicamente. En este documento, proponemos una nueva definición de un metapath en la que el tipo de borde, es decir, la relación entre nodos, se integra en él. Un grafo heterogéneo se puede considerar como el compuesto de múltiples subgráficos de relación desde el punto de vista de un nuevo metapath. En diferentes subgráficos, las incrustaciones de un nodo se entrenan por separado codificando y agregando los vecinos de los intrapaths, que son los niveles de instancia de un nuevo metapath. Luego, la incrustación final del nodo se obtiene mediante el uso del mecanismo de atención que agrega nodos de los interpaths, que es el nivel semántico de los nuevos metapaths. La predicción de enlaces es una tarea secundaria mediante la cual evaluar la efectividad de las incrustaciones aprendidas. Realizamos experimentos extensos en tres conjuntos de datos de grafo heterogéneo del mundo real para la predicción de enlaces. Los resultados empíricos muestran que el modelo propuesto supera a las líneas de base de última generación; en particular, al compararlo con la mejor línea de base, la métrica F1 aumenta en un 10.35% en un conjunto de datos de Alibaba.
Descripción
Junto con el crecimiento de las redes neuronales de grafos (GNNs), muchos investigadores han adoptado GNNs basadas en metapath para manejar la incrustación de grafos heterogéneos complejos. La definición convencional de un metapath solo distingue si hay una conexión entre nodos en el esquema de red, donde se ignora el tipo de borde. Esto conduce a una representación inexacta de nodos y posteriormente resulta en un rendimiento de predicción subóptimo. En grafos heterogéneos, un nodo puede estar conectado por múltiples tipos de bordes. De hecho, cada tipo de borde representa un tipo de escena. La intuición es que si la incrustación de nodos se entrena bajo diferentes escenas, la representación completa de nodos se puede obtener combinándolos orgánicamente. En este documento, proponemos una nueva definición de un metapath en la que el tipo de borde, es decir, la relación entre nodos, se integra en él. Un grafo heterogéneo se puede considerar como el compuesto de múltiples subgráficos de relación desde el punto de vista de un nuevo metapath. En diferentes subgráficos, las incrustaciones de un nodo se entrenan por separado codificando y agregando los vecinos de los intrapaths, que son los niveles de instancia de un nuevo metapath. Luego, la incrustación final del nodo se obtiene mediante el uso del mecanismo de atención que agrega nodos de los interpaths, que es el nivel semántico de los nuevos metapaths. La predicción de enlaces es una tarea secundaria mediante la cual evaluar la efectividad de las incrustaciones aprendidas. Realizamos experimentos extensos en tres conjuntos de datos de grafo heterogéneo del mundo real para la predicción de enlaces. Los resultados empíricos muestran que el modelo propuesto supera a las líneas de base de última generación; en particular, al compararlo con la mejor línea de base, la métrica F1 aumenta en un 10.35% en un conjunto de datos de Alibaba.