Un modelo de razonamiento de gráficos dinámicos con una tarea auxiliar para responder preguntas de bases de conocimiento
Autores: Wu, Zhichao; Tian, Xuan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo de razonamiento de gráficos dinámicos con una tarea auxiliar para responder preguntas de bases de conocimiento
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Campo
Base de conocimientos para responder preguntas
Subgrafo de inferencia
Conocimiento del dominio
Precisión
Tarea auxiliar
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
En el campo de la respuesta a preguntas (QA), los métodos de modelos de lenguaje grandes (LLMs) no pueden aprender conocimiento vertical del dominio durante la etapa de pre-entrenamiento, lo que lleva a una baja precisión en QA de dominio. Por el contrario, la respuesta a preguntas de base de conocimiento (KBQA) puede combinar la base de conocimiento (KB) que contiene conocimiento del dominio con modelos de lenguaje pequeños para lograr alta precisión con un bajo costo. En KBQA, el subgrafo de inferencia está compuesto por nodos de entidad y sus relaciones pertinentes a la pregunta, con las respuestas finales derivadas del subgrafo. Sin embargo, todavía existen dos problemas críticos en este campo: (i) los alcances fijos o disminuidos de los subgrafos de inferencia durante el proceso de razonamiento pueden llevar a un conocimiento limitado, restringido en KBQA, y (ii) una falta de alineación entre el subgrafo de inferencia y la pregunta lleva a una baja precisión. En este trabajo, proponemos un modelo de razonamiento de gráficos dinámicos con una tarea auxiliar, el DGRMWAT, que aborda los desafíos anteriores a través de dos innovaciones clave, como sigue: (i) razonamiento de gráficos dinámicos, donde actualizamos el alcance del subgrafo de inferencia durante cada paso de razonamiento para obtener conocimiento más relevante y reducir el conocimiento irrelevante, y (ii) una tarea auxiliar para mejorar la correlación entre el subgrafo de inferencia y la pregunta mediante el cálculo de las similitudes entre el subgrafo de inferencia y el nodo de contexto de QA. Los experimentos en dos conjuntos de datos de referencia de QA, CommonsenseQA y OpenbookQA, indican que el DGRMWAT permitió mejoras en comparación con los modelos de referencia y LLMs.
Descripción
En el campo de la respuesta a preguntas (QA), los métodos de modelos de lenguaje grandes (LLMs) no pueden aprender conocimiento vertical del dominio durante la etapa de pre-entrenamiento, lo que lleva a una baja precisión en QA de dominio. Por el contrario, la respuesta a preguntas de base de conocimiento (KBQA) puede combinar la base de conocimiento (KB) que contiene conocimiento del dominio con modelos de lenguaje pequeños para lograr alta precisión con un bajo costo. En KBQA, el subgrafo de inferencia está compuesto por nodos de entidad y sus relaciones pertinentes a la pregunta, con las respuestas finales derivadas del subgrafo. Sin embargo, todavía existen dos problemas críticos en este campo: (i) los alcances fijos o disminuidos de los subgrafos de inferencia durante el proceso de razonamiento pueden llevar a un conocimiento limitado, restringido en KBQA, y (ii) una falta de alineación entre el subgrafo de inferencia y la pregunta lleva a una baja precisión. En este trabajo, proponemos un modelo de razonamiento de gráficos dinámicos con una tarea auxiliar, el DGRMWAT, que aborda los desafíos anteriores a través de dos innovaciones clave, como sigue: (i) razonamiento de gráficos dinámicos, donde actualizamos el alcance del subgrafo de inferencia durante cada paso de razonamiento para obtener conocimiento más relevante y reducir el conocimiento irrelevante, y (ii) una tarea auxiliar para mejorar la correlación entre el subgrafo de inferencia y la pregunta mediante el cálculo de las similitudes entre el subgrafo de inferencia y el nodo de contexto de QA. Los experimentos en dos conjuntos de datos de referencia de QA, CommonsenseQA y OpenbookQA, indican que el DGRMWAT permitió mejoras en comparación con los modelos de referencia y LLMs.