Infomax classification-enhanced learnable network para la clasificación de nodos de pocos disparos
Autores: Xu, Xin; Du, Junping; Song, Jie; Xue, Zhe
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Infomax classification-enhanced learnable network para la clasificación de nodos de pocos disparos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales gráficas
Clasificación de nodos
Clasificación de nodos de pocos ejemplos
Transferencia de información
Grafos de conocimiento
ICELN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Las redes neuronales gráficas tienen una amplia gama de aplicaciones, como redes de citas, redes sociales y grafos de conocimiento. Entre varios análisis de grafos, la clasificación de nodos ha llamado mucho la atención. Aunque muchos de los modelos de incrustación de redes recientes logran un rendimiento prometedor, generalmente requieren nodos etiquetados suficientes para el entrenamiento, lo cual no se ajusta a la realidad de que solo unos pocos nodos etiquetados están disponibles en clases novedosas. Aunque comúnmente se emplea en los dominios de visión y lenguaje para abordar el problema de muestras de entrenamiento insuficientes, todavía existen dos características del problema de clasificación de nodos de pocos disparos en el dominio no euclidiano que requieren investigación: (1) cómo extraer el conocimiento más informativo para una clase y utilizarlo en los datos de prueba y (2) cómo explorar a fondo el número limitado de conjuntos de soporte y maximizar la cantidad de información transferida al conjunto de consultas. Proponemos una Red Aprendible Mejorada de Clasificación de Información Máxima (ICELN) para abordar estos problemas, motivados por Deep Graph InfoMax (DGI), que adapta el principio de InfoMax a la representación resumida de un grafo y la representación de un parche de un nodo. Al aumentar la cantidad de información compartida entre los nodos de consulta y la representación de clase, un ICELN puede transferir la máxima cantidad de información a datos no etiquetados y mejorar el potencial de representación del grafo. Todo el modelo se entrena utilizando un método episódico, que simula el entorno de prueba real para garantizar que el metaconocimiento aprendido de la experiencia previa pueda ser utilizado para clases completamente nuevas que no se han estudiado antes. Se realizan experimentos extensos en cinco conjuntos de datos del mundo real para demostrar las ventajas de un ICELN sobre los métodos existentes de clasificación de nodos de pocos disparos.
Descripción
Las redes neuronales gráficas tienen una amplia gama de aplicaciones, como redes de citas, redes sociales y grafos de conocimiento. Entre varios análisis de grafos, la clasificación de nodos ha llamado mucho la atención. Aunque muchos de los modelos de incrustación de redes recientes logran un rendimiento prometedor, generalmente requieren nodos etiquetados suficientes para el entrenamiento, lo cual no se ajusta a la realidad de que solo unos pocos nodos etiquetados están disponibles en clases novedosas. Aunque comúnmente se emplea en los dominios de visión y lenguaje para abordar el problema de muestras de entrenamiento insuficientes, todavía existen dos características del problema de clasificación de nodos de pocos disparos en el dominio no euclidiano que requieren investigación: (1) cómo extraer el conocimiento más informativo para una clase y utilizarlo en los datos de prueba y (2) cómo explorar a fondo el número limitado de conjuntos de soporte y maximizar la cantidad de información transferida al conjunto de consultas. Proponemos una Red Aprendible Mejorada de Clasificación de Información Máxima (ICELN) para abordar estos problemas, motivados por Deep Graph InfoMax (DGI), que adapta el principio de InfoMax a la representación resumida de un grafo y la representación de un parche de un nodo. Al aumentar la cantidad de información compartida entre los nodos de consulta y la representación de clase, un ICELN puede transferir la máxima cantidad de información a datos no etiquetados y mejorar el potencial de representación del grafo. Todo el modelo se entrena utilizando un método episódico, que simula el entorno de prueba real para garantizar que el metaconocimiento aprendido de la experiencia previa pueda ser utilizado para clases completamente nuevas que no se han estudiado antes. Se realizan experimentos extensos en cinco conjuntos de datos del mundo real para demostrar las ventajas de un ICELN sobre los métodos existentes de clasificación de nodos de pocos disparos.