¿abrumado con demasiados artículos? graphrag hace que empezar sea fácil
Autores: Ngangmeni, Joëd; Rawat, Danda B.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
¿abrumado con demasiados artículos? graphrag hace que empezar sea fácil
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Investigadores
Métodos de recuperación
Rendimiento
Consultas
Submodelos
Resultados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Antecedentes: Tanto los investigadores principiantes, como los nuevos estudiantes de posgrado, y los investigadores experimentados enfrentan el desafío de tamizar a través de vastas cantidades de literatura para encontrar su aguja en un pajar. Este proceso puede ser consumidor de tiempo, tedioso o frustrantemente poco productivo. Métodos: Utilizando solo resúmenes y títulos de artículos de investigación, comparamos tres métodos de recuperación: Indexación/Bases de datos bibliográficas (BI/D), Generación con Recuperación Aumentada (RAG) y Generación con Recuperación Aumentada de Grafos (GraphRAG), que supuestamente ofrecen soluciones prometedoras a estos desafíos comunes. Evaluamos su rendimiento utilizando dos conjuntos de consultas generadas por un Modelo de Lenguaje Grande (LLM): un conjunto de consultas con contexto y otro conjunto sin contexto. Nuestro estudio evalúa seis submodelos -cuatro de Light Generación con Recuperación Aumentada (LightRAG) y dos de Generación con Recuperación Aumentada de Grafos de Microsoft (MGRAG). Examinamos estos submodelos en cuatro criterios clave -completitud, diversidad, empoderamiento y directividad- así como la combinación general de estos factores. Resultados: Después de tres experimentos separados, observamos que MGRAG tiene una ligera ventaja sobre LightRAG, RAG ingenuo y BI/D para responder a consultas que requieren una comprensión semántica de nuestro conjunto de datos. Los resultados (mostrados en gráficos de barras agrupados) proporcionan comparaciones claras y accesibles para ayudar a los investigadores a tomar decisiones informadas rápidamente sobre qué método se adapta mejor a sus necesidades. Conclusiones: Suplementar BI/D con tuberías de RAG o GraphRAG impactaría positivamente en la forma en que tanto los principiantes como los investigadores experimentados encuentran y analizan volúmenes de información potencialmente relevantes.
Descripción
Antecedentes: Tanto los investigadores principiantes, como los nuevos estudiantes de posgrado, y los investigadores experimentados enfrentan el desafío de tamizar a través de vastas cantidades de literatura para encontrar su aguja en un pajar. Este proceso puede ser consumidor de tiempo, tedioso o frustrantemente poco productivo. Métodos: Utilizando solo resúmenes y títulos de artículos de investigación, comparamos tres métodos de recuperación: Indexación/Bases de datos bibliográficas (BI/D), Generación con Recuperación Aumentada (RAG) y Generación con Recuperación Aumentada de Grafos (GraphRAG), que supuestamente ofrecen soluciones prometedoras a estos desafíos comunes. Evaluamos su rendimiento utilizando dos conjuntos de consultas generadas por un Modelo de Lenguaje Grande (LLM): un conjunto de consultas con contexto y otro conjunto sin contexto. Nuestro estudio evalúa seis submodelos -cuatro de Light Generación con Recuperación Aumentada (LightRAG) y dos de Generación con Recuperación Aumentada de Grafos de Microsoft (MGRAG). Examinamos estos submodelos en cuatro criterios clave -completitud, diversidad, empoderamiento y directividad- así como la combinación general de estos factores. Resultados: Después de tres experimentos separados, observamos que MGRAG tiene una ligera ventaja sobre LightRAG, RAG ingenuo y BI/D para responder a consultas que requieren una comprensión semántica de nuestro conjunto de datos. Los resultados (mostrados en gráficos de barras agrupados) proporcionan comparaciones claras y accesibles para ayudar a los investigadores a tomar decisiones informadas rápidamente sobre qué método se adapta mejor a sus necesidades. Conclusiones: Suplementar BI/D con tuberías de RAG o GraphRAG impactaría positivamente en la forma en que tanto los principiantes como los investigadores experimentados encuentran y analizan volúmenes de información potencialmente relevantes.