Red de Mejora de Nodos y Bordes: Método de Clasificación de Nodos de Grafo Desbalanceado Basado en Mejora Colaborativa de Bordes y Nodos
Autores: Tian, Jiadong; Lin, Jiali; Li, Dagang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Red de Mejora de Nodos y Bordes: Método de Clasificación de Nodos de Grafo Desbalanceado Basado en Mejora Colaborativa de Bordes y Nodos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Clasificación de nodos
Distribución desequilibrada de datos
Distribución de bordes
Incrustaciones de nodos
ENE-GCN
Mejora colaborativa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Al abordar el problema de la clasificación de nodos con distribución desequilibrada de datos, los modelos tradicionales muestran limitaciones significativas. Los métodos de mejora convencionales, como la replicación de nodos o el ajuste de peso, a menudo se centran únicamente en los nodos, descuidando las relaciones de conexión. Sin embargo, numerosos estudios han demostrado que optimizar la distribución de bordes puede mejorar la calidad de los embeddings de nodos. En este documento, proponemos el método de Mejora Colaborativa de Bordes y Nodos (ENE-GCN). Este método identifica pares de nodos potencialmente asociados mediante medidas de similitud y construye una matriz de adyacencia híbrida, que amplía el espacio de ajuste de la incrustación de nodos. Posteriormente, se emplea una estrategia de generación adversarial para aumentar los nodos de la clase minoritaria, construyendo así un conjunto de muestras equilibrado. En comparación con los métodos existentes, nuestro enfoque logra una mejora colaborativa tanto de bordes como de nodos de manera concisa, mejorando la calidad de la incrustación y equilibrando el escenario de entrenamiento. Las comparaciones experimentales en cuatro conjuntos de datos de gráficos públicos revelan que, en comparación con los métodos de referencia, nuestro método propuesto logra mejoras notables en las métricas de Recall y AUC, especialmente en conjuntos de datos escasamente conectados.
Descripción
Al abordar el problema de la clasificación de nodos con distribución desequilibrada de datos, los modelos tradicionales muestran limitaciones significativas. Los métodos de mejora convencionales, como la replicación de nodos o el ajuste de peso, a menudo se centran únicamente en los nodos, descuidando las relaciones de conexión. Sin embargo, numerosos estudios han demostrado que optimizar la distribución de bordes puede mejorar la calidad de los embeddings de nodos. En este documento, proponemos el método de Mejora Colaborativa de Bordes y Nodos (ENE-GCN). Este método identifica pares de nodos potencialmente asociados mediante medidas de similitud y construye una matriz de adyacencia híbrida, que amplía el espacio de ajuste de la incrustación de nodos. Posteriormente, se emplea una estrategia de generación adversarial para aumentar los nodos de la clase minoritaria, construyendo así un conjunto de muestras equilibrado. En comparación con los métodos existentes, nuestro enfoque logra una mejora colaborativa tanto de bordes como de nodos de manera concisa, mejorando la calidad de la incrustación y equilibrando el escenario de entrenamiento. Las comparaciones experimentales en cuatro conjuntos de datos de gráficos públicos revelan que, en comparación con los métodos de referencia, nuestro método propuesto logra mejoras notables en las métricas de Recall y AUC, especialmente en conjuntos de datos escasamente conectados.