Mitigación de alucinaciones en la finalización de grafos de conocimiento a través de la sintonización de instrucciones guiada por incrustaciones
Autores: Zhang, Pengfei; Xu, Xing; Wu, Junying; Lu, Xin; Shi, Jiahao; Zhang, Xiaodong; Cui, Dezhi; Peng, Xiuxian; He, Sihao; Zong, Ping; Zhang, Guoxin; Ou, Zhonghong; Song, Meina; Zhu, Yifan
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Mitigación de alucinaciones en la finalización de grafos de conocimiento a través de la sintonización de instrucciones guiada por incrustaciones
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Gráficas de conocimiento
Modelos de lenguaje grandes
Completación de gráficas de conocimiento
Ajuste de instrucción guiado por incrustaciones
Precisión estructural
Razonamiento semántico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los Grafos de Conocimiento (KGs) del mundo real son inherentemente incompletos, lo que dificulta un razonamiento efectivo en etapas posteriores. Aunque los Modelos de Lenguaje Grande (LLMs) poseen poderosas capacidades semánticas, aplicarlos directamente a la Compleción de Grafos de Conocimiento (KGC) a menudo conduce a alucinaciones y a una falta de conciencia estructural. Para abordar estos desafíos, proponemos el Ajuste de Instrucciones Guiado por Embeddings (EGIT), un marco novedoso que sinergiza la precisión estructural de los modelos de embeddings con el razonamiento semántico de los LLMs. Nuestro enfoque opera en tres etapas clave: (1) utilizar modelos de embeddings preentrenados para sintetizar automáticamente datos de instrucciones de alta calidad y sin anotaciones; (2) ajustar el LLM con estas instrucciones conscientes de la estructura para adaptarlo a la tarea de KGC; y (3) emplear un mecanismo de inferencia conjunta donde el modelo de embeddings recupera candidatos y el LLM ajustado realiza la selección final, reduciendo así significativamente las alucinaciones. En experimentos extensos, la mejor variante de EGIT logra mejoras del 7.0% y 2.5% en Hits@1 en los conjuntos de datos FB15k-237 y WN18RR, respectivamente.
Descripción
Los Grafos de Conocimiento (KGs) del mundo real son inherentemente incompletos, lo que dificulta un razonamiento efectivo en etapas posteriores. Aunque los Modelos de Lenguaje Grande (LLMs) poseen poderosas capacidades semánticas, aplicarlos directamente a la Compleción de Grafos de Conocimiento (KGC) a menudo conduce a alucinaciones y a una falta de conciencia estructural. Para abordar estos desafíos, proponemos el Ajuste de Instrucciones Guiado por Embeddings (EGIT), un marco novedoso que sinergiza la precisión estructural de los modelos de embeddings con el razonamiento semántico de los LLMs. Nuestro enfoque opera en tres etapas clave: (1) utilizar modelos de embeddings preentrenados para sintetizar automáticamente datos de instrucciones de alta calidad y sin anotaciones; (2) ajustar el LLM con estas instrucciones conscientes de la estructura para adaptarlo a la tarea de KGC; y (3) emplear un mecanismo de inferencia conjunta donde el modelo de embeddings recupera candidatos y el LLM ajustado realiza la selección final, reduciendo así significativamente las alucinaciones. En experimentos extensos, la mejor variante de EGIT logra mejoras del 7.0% y 2.5% en Hits@1 en los conjuntos de datos FB15k-237 y WN18RR, respectivamente.