GRAAL: Recuperación Basada en Gráficos para la Recolección de Pasajes Relacionados a Través de Múltiples Documentos
Autores: Mongiovì, Misael; Gangemi, Aldo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
GRAAL: Recuperación Basada en Gráficos para la Recolección de Pasajes Relacionados a Través de Múltiples Documentos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Pasajes
Verificación de afirmaciones
Respuesta a preguntas de dominio abierto
GRAAL
Enfoque basado en grafos
Evidencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Encontrar pasajes relacionados con una oración en una gran colección de documentos de texto es una tarea fundamental para la verificación de afirmaciones y la respuesta a preguntas de dominio abierto. Por ejemplo, un enfoque común para verificar una afirmación es extraer fragmentos cortos de texto relevante de una colección de documentos de referencia y proporcionarlos como entrada a una máquina de inferencia en lenguaje natural que determina si la afirmación puede ser deducida o refutada. Los enfoques disponibles tienen dificultades cuando se necesitan combinar varias piezas de evidencia de diferentes documentos para hacer una inferencia, ya que los documentos individuales a menudo tienen una baja relevancia con la entrada y, por lo tanto, son excluidos. Proponemos GRAAL (GRAph-based retrievAL), un enfoque novedoso basado en grafos que describe la evidencia relevante como un subgrafo de un gran grafo que resume todo el corpus. Evaluamos la validez de este enfoque construyendo un gran grafo que representa menciones de entidades coocurrentes en un corpus de páginas de Wikipedia y utilizando este grafo para identificar texto candidato relevante para una afirmación en múltiples páginas. Nuestros experimentos en un subconjunto de FEVER, un benchmark popular, muestran que el enfoque propuesto es efectivo para identificar pasajes cortos relacionados con una afirmación de múltiples documentos.
Descripción
Encontrar pasajes relacionados con una oración en una gran colección de documentos de texto es una tarea fundamental para la verificación de afirmaciones y la respuesta a preguntas de dominio abierto. Por ejemplo, un enfoque común para verificar una afirmación es extraer fragmentos cortos de texto relevante de una colección de documentos de referencia y proporcionarlos como entrada a una máquina de inferencia en lenguaje natural que determina si la afirmación puede ser deducida o refutada. Los enfoques disponibles tienen dificultades cuando se necesitan combinar varias piezas de evidencia de diferentes documentos para hacer una inferencia, ya que los documentos individuales a menudo tienen una baja relevancia con la entrada y, por lo tanto, son excluidos. Proponemos GRAAL (GRAph-based retrievAL), un enfoque novedoso basado en grafos que describe la evidencia relevante como un subgrafo de un gran grafo que resume todo el corpus. Evaluamos la validez de este enfoque construyendo un gran grafo que representa menciones de entidades coocurrentes en un corpus de páginas de Wikipedia y utilizando este grafo para identificar texto candidato relevante para una afirmación en múltiples páginas. Nuestros experimentos en un subconjunto de FEVER, un benchmark popular, muestran que el enfoque propuesto es efectivo para identificar pasajes cortos relacionados con una afirmación de múltiples documentos.