Red de Atención de Grafos Mejorada por Conocimiento para la Verificación de Hechos
Autores: Chen, Chonghao; Zheng, Jianming; Chen, Honghui
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Red de Atención de Grafos Mejorada por Conocimiento para la Verificación de Hechos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Verificación de hechos
Oraciones de evidencia
Métodos de inferencia de lenguaje natural
Estructura de gráficos
Módulo de integración de conocimiento
Conocimiento externo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La verificación de hechos tiene como objetivo evaluar la autenticidad de una afirmación dada basada en las oraciones de evidencia recuperadas de los artículos de Wikipedia. Los trabajos existentes principalmente aprovechan los métodos de inferencia de lenguaje natural para modelar la interacción semántica de la afirmación y la evidencia, o emplean además la estructura de grafo para capturar las características de relación entre múltiples evidencias. Sin embargo, los métodos anteriores tienen una capacidad de representación limitada para codificar unidades complicadas de afirmación y evidencias, y por lo tanto no pueden soportar un razonamiento sofisticado. Además, una cantidad limitada de señales de supervisión hacen que el codificador de grafo no pueda distinguir las diferencias de las diferentes estructuras de grafo y debilitar la capacidad de codificación. Para abordar los problemas anteriores, proponemos una red de Atención de Grafo Mejorada con Conocimiento (KEGA) para la verificación de hechos, que introduce un módulo de integración de conocimiento para mejorar la representación de afirmaciones y evidencias mediante la incorporación de conocimiento externo. Además, KEGA aprovecha una pérdida auxiliar basada en el aprendizaje contrastivo para ajustar finamente el codificador de atención de grafo y aprender las características discriminativas para el grafo de evidencia. Experimentos exhaustivos realizados en FEVER, un conjunto de datos de referencia a gran escala para la verificación de hechos, demuestran la superioridad de nuestra propuesta tanto en escenarios de múltiples evidencias como de una sola evidencia. Además, nuestros hallazgos muestran que el conocimiento de fondo para las palabras puede mejorar efectivamente el rendimiento del modelo.
Descripción
La verificación de hechos tiene como objetivo evaluar la autenticidad de una afirmación dada basada en las oraciones de evidencia recuperadas de los artículos de Wikipedia. Los trabajos existentes principalmente aprovechan los métodos de inferencia de lenguaje natural para modelar la interacción semántica de la afirmación y la evidencia, o emplean además la estructura de grafo para capturar las características de relación entre múltiples evidencias. Sin embargo, los métodos anteriores tienen una capacidad de representación limitada para codificar unidades complicadas de afirmación y evidencias, y por lo tanto no pueden soportar un razonamiento sofisticado. Además, una cantidad limitada de señales de supervisión hacen que el codificador de grafo no pueda distinguir las diferencias de las diferentes estructuras de grafo y debilitar la capacidad de codificación. Para abordar los problemas anteriores, proponemos una red de Atención de Grafo Mejorada con Conocimiento (KEGA) para la verificación de hechos, que introduce un módulo de integración de conocimiento para mejorar la representación de afirmaciones y evidencias mediante la incorporación de conocimiento externo. Además, KEGA aprovecha una pérdida auxiliar basada en el aprendizaje contrastivo para ajustar finamente el codificador de atención de grafo y aprender las características discriminativas para el grafo de evidencia. Experimentos exhaustivos realizados en FEVER, un conjunto de datos de referencia a gran escala para la verificación de hechos, demuestran la superioridad de nuestra propuesta tanto en escenarios de múltiples evidencias como de una sola evidencia. Además, nuestros hallazgos muestran que el conocimiento de fondo para las palabras puede mejorar efectivamente el rendimiento del modelo.