logo móvil
Contáctanos

Un estudio empírico de RAG mejorado con grafos de conocimiento para el cumplimiento de la seguridad de la información

Autores: Jovanovski, Dimitar; Stojcheva, Marija; Dodevska, Mila; Lameski, Petre; Mishkovski, Igor; Gjorgjevikj, Dejan

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Un estudio empírico de RAG mejorado con grafos de conocimiento para el cumplimiento de la seguridad de la información


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Seguridad de la información
Familia ISO/IEC 27000
Cumplimiento
Marco RAG que preserva la privacidad
Sistema de recuperación basado en grafos de conocimiento
Conjunto de datos de evaluación de referencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El cumplimiento de la seguridad de la información se ha vuelto crítico para las organizaciones en todo el mundo, siendo la familia ISO/IEC 27000 el marco más adoptado para establecer sistemas de gestión de seguridad de la información. A pesar de su aceptación global, estas normas presentan desafíos significativos de interpretación debido a su lenguaje formal, estructura abstracta y extensa referencia cruzada en 97 documentos. Los sistemas tradicionales de generación aumentada por recuperación (RAG), que dependen de la segmentación de texto independiente y la recuperación de vectores densos, resultan inadecuados para materiales regulatorios tan interconectados, a menudo fragmentando las relaciones contextuales y reduciendo la precisión. Este estudio introduce un marco RAG que preserva la privacidad e integra LightRAG, un sistema de recuperación basado en grafos de conocimiento, con modelos de lenguaje de código abierto alojados localmente. A diferencia de los sistemas RAG basados en segmentos que tratan los segmentos de documentos de manera independiente, el sistema en este estudio construye un grafo de conocimiento semántico que modela explícitamente las relaciones entre cláusulas a través de bordes tipados que representan referencias cruzadas, similitud semántica y dependencias jerárquicas. Para permitir una evaluación rigurosa, desarrollamos un conjunto de datos de referencia curado de 222 preguntas de opción múltiple con respuestas de verdad autorizadas, construidas sistemáticamente a partir de normas ISO oficiales, materiales de preparación para certificaciones y fuentes académicas. A través de una evaluación sistemática en este conjunto de referencia, mostramos que la recuperación basada en grafos de conocimiento logra una mayor precisión que RAG basado en segmentos y líneas base de LLM no recuperativas dentro de la configuración evaluada. El análisis indica que la calidad del modelo de incrustación está fuertemente asociada con el rendimiento del sistema, que los modos de recuperación híbridos que combinan el recorrido de grafos local y global tienden a ofrecer mejor precisión, y que los modelos de código abierto de tamaño mediano emparejados con recuperadores fuertes pueden acercarse al rendimiento de sistemas propietarios más grandes. La mejor configuración logra una precisión del 90.54%, demostrando la prometedora efectividad de la recuperación estructurada en grafos para preguntas regulatorias de opción múltiple.

Otros recursos que podrían interesarte

Temas Virtualpro