Meta-híbrido: integrar el meta-aprendizaje para mejorar el aprendizaje gráfico del desequilibrio de clases
Autores: Ran, Liming; Sun, Hongyu; Gao, Lanqi; Dong, Yanhua; Lu, Yang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Meta-híbrido: integrar el meta-aprendizaje para mejorar el aprendizaje gráfico del desequilibrio de clases
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Problema de desequilibrio de clases
Tareas de clasificación de nodos
Clases minoritarias
Marco GraphSHX
Modelo XGBoost
Enfoque de meta-aprendizaje
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
El problema del desequilibrio de clases es un desafío significativo en las tareas de clasificación de nodos. Dado que las muestras de la clase mayoritaria dominan los datos desequilibrados, el modelo tiende a favorecer la clase mayoritaria, lo que resulta en una capacidad insuficiente para identificar las clases minoritarias. Los indicadores de evaluación como la precisión pueden no reflejar completamente el rendimiento del modelo. Para resolver estos efectos no deseados, proponemos un marco para sintetizar muestras de la clase minoritaria, GraphSHX, para equilibrar el número de muestras de diferentes clases, e integrar el modelo XGBoost para la predicción de clasificación de nodos durante el proceso de entrenamiento. Las redes neuronales gráficas convencionales (GNNs) arrojaron resultados insatisfactorios, posiblemente debido al número limitado de nodos recién generados. Por lo tanto, introducimos un meta-mecanismo para abordar problemas de muestras pequeñas y empleamos el enfoque de meta-aprendizaje para mejorar el rendimiento en tareas de muestras pequeñas aprendiendo de un gran número de tareas. Una evaluación empírica de la clasificación de nodos en seis conjuntos de datos públicos demostró que nuestro método de conjunto de datos equilibrado supera a los métodos existentes de reparación óptima de pérdidas y métodos de nodos sintéticos. La adición del modelo XGBoost y el meta-aprendizaje mejora la precisión en más del 5% al 10%, siendo la precisión general del modelo mejorado un 15% más alta que la del método de referencia.
Descripción
El problema del desequilibrio de clases es un desafío significativo en las tareas de clasificación de nodos. Dado que las muestras de la clase mayoritaria dominan los datos desequilibrados, el modelo tiende a favorecer la clase mayoritaria, lo que resulta en una capacidad insuficiente para identificar las clases minoritarias. Los indicadores de evaluación como la precisión pueden no reflejar completamente el rendimiento del modelo. Para resolver estos efectos no deseados, proponemos un marco para sintetizar muestras de la clase minoritaria, GraphSHX, para equilibrar el número de muestras de diferentes clases, e integrar el modelo XGBoost para la predicción de clasificación de nodos durante el proceso de entrenamiento. Las redes neuronales gráficas convencionales (GNNs) arrojaron resultados insatisfactorios, posiblemente debido al número limitado de nodos recién generados. Por lo tanto, introducimos un meta-mecanismo para abordar problemas de muestras pequeñas y empleamos el enfoque de meta-aprendizaje para mejorar el rendimiento en tareas de muestras pequeñas aprendiendo de un gran número de tareas. Una evaluación empírica de la clasificación de nodos en seis conjuntos de datos públicos demostró que nuestro método de conjunto de datos equilibrado supera a los métodos existentes de reparación óptima de pérdidas y métodos de nodos sintéticos. La adición del modelo XGBoost y el meta-aprendizaje mejora la precisión en más del 5% al 10%, siendo la precisión general del modelo mejorado un 15% más alta que la del método de referencia.