Mejorando los Servicios de Conocimiento sobre Cerámica Antigua: Un Sistema de Respuestas a Preguntas Utilizando Modelos Ajustados y GraphRAG
Autores: Chen, Zhi; Liu, Bingxiang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Mejorando los Servicios de Conocimiento sobre Cerámica Antigua: Un Sistema de Respuestas a Preguntas Utilizando Modelos Ajustados y GraphRAG
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Sistema de respuesta a preguntas de conocimiento
Adaptación de Bajo Rango
Generación Aumentada por Recuperación de Gráficos
Cerámica antigua
Mejoras en el rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para abordar los desafíos de la extensa experiencia en el dominio y la deficiente comprensión semántica en la preservación digital de cerámicas antiguas, este documento propone un sistema de preguntas y respuestas (QA) basado en conocimiento que integra la adaptación de bajo rango (LoRA) y la generación aumentada por recuperación gráfica (GraphRAG). Primero, se genera información textual de imágenes de cerámica utilizando el modelo GLM-4V-9B. Estos textos se enriquecen con literatura del dominio para producir pares de preguntas y respuestas sobre cerámicas antiguas a través de ERNIE 4.0 Turbo, culminando en un conjunto de datos de alta calidad de 2143 grupos de preguntas y respuestas curadas tras un refinamiento manual. En segundo lugar, se empleó el ajuste fino de LoRA en el modelo base Qwen2.5-7B-Instruct, mejorando significativamente su competencia en preguntas y respuestas específicamente para el dominio de cerámicas antiguas. Finalmente, se integra el marco GraphRAG, combinando el modelo de lenguaje grande ajustado con el análisis de rutas de grafos de conocimiento para aumentar las capacidades de razonamiento de múltiples saltos para consultas complejas. Los resultados experimentales demuestran mejoras en el rendimiento del 24.08% en ROUGE-1, 34.75% en ROUGE-2, 29.78% en ROUGE-L y 4.52% en BERTScore_F1 en comparación con el modelo base. Esta evidencia muestra que la implementación sinérgica del ajuste fino de LoRA y GraphRAG ofrece mejoras significativas en el rendimiento de los sistemas de conocimiento sobre cerámica, estableciendo un marco técnico replicable para servicios de conocimiento inteligente sobre patrimonio cultural.
Descripción
Para abordar los desafíos de la extensa experiencia en el dominio y la deficiente comprensión semántica en la preservación digital de cerámicas antiguas, este documento propone un sistema de preguntas y respuestas (QA) basado en conocimiento que integra la adaptación de bajo rango (LoRA) y la generación aumentada por recuperación gráfica (GraphRAG). Primero, se genera información textual de imágenes de cerámica utilizando el modelo GLM-4V-9B. Estos textos se enriquecen con literatura del dominio para producir pares de preguntas y respuestas sobre cerámicas antiguas a través de ERNIE 4.0 Turbo, culminando en un conjunto de datos de alta calidad de 2143 grupos de preguntas y respuestas curadas tras un refinamiento manual. En segundo lugar, se empleó el ajuste fino de LoRA en el modelo base Qwen2.5-7B-Instruct, mejorando significativamente su competencia en preguntas y respuestas específicamente para el dominio de cerámicas antiguas. Finalmente, se integra el marco GraphRAG, combinando el modelo de lenguaje grande ajustado con el análisis de rutas de grafos de conocimiento para aumentar las capacidades de razonamiento de múltiples saltos para consultas complejas. Los resultados experimentales demuestran mejoras en el rendimiento del 24.08% en ROUGE-1, 34.75% en ROUGE-2, 29.78% en ROUGE-L y 4.52% en BERTScore_F1 en comparación con el modelo base. Esta evidencia muestra que la implementación sinérgica del ajuste fino de LoRA y GraphRAG ofrece mejoras significativas en el rendimiento de los sistemas de conocimiento sobre cerámica, estableciendo un marco técnico replicable para servicios de conocimiento inteligente sobre patrimonio cultural.