Construcción de un Grafo de Conocimiento Legal Basado en Modelos de Lenguaje de Gran Escala Mejorados por Conocimiento
Autores: Li, Jun; Qian, Lu; Liu, Peifeng; Liu, Taoxiong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Construcción de un Grafo de Conocimiento Legal Basado en Modelos de Lenguaje de Gran Escala Mejorados por Conocimiento
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Conocimiento legal
Tecnología de grafos de conocimiento
Interpretaciones judiciales
Disposiciones legales
Precisión en la extracción de conocimiento
Casos legales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El conocimiento legal implica un conocimiento heterogéneo multidimensional, como disposiciones legales, interpretaciones judiciales, casos judiciales y defensas, lo que requiere una relevancia y precisión extremadamente altas del conocimiento. Mientras tanto, la construcción de un sistema de razonamiento de conocimiento legal también enfrenta desafíos en la obtención, procesamiento y compartición de conocimiento heterogéneo de múltiples fuentes. La tecnología de grafos de conocimiento, que es una forma de organización del conocimiento con triples como unidad básica, puede transformar de manera eficiente la información heterogénea de múltiples fuentes en una forma de representación del conocimiento cercana a la cognición humana. Tomando la construcción automatizada del grafo de conocimiento legal chino (CLKG) como un escenario de caso, este documento presenta un modelo conjunto de mejora del conocimiento (JKEM), donde el conocimiento previo se incorpora en un modelo de lenguaje grande (LLM), y el LLM se ajusta finamente a través del prefijo de los datos de conocimiento previo. Bajo la condición de congelar la mayoría de los parámetros del LLM, este esquema de ajuste fino añade indicaciones profundas continuas como tokens de prefijo a las secuencias de entrada de diferentes capas, lo que puede mejorar significativamente la precisión de la extracción de conocimiento. Los resultados muestran que la precisión de extracción de conocimiento del JKEM en este documento alcanza el 90.92%. Basado en el rendimiento superior de este modelo, el CLKG se construye aún más, que contiene 3480 triples de conocimiento compuestos por 9 entidades y 2 relaciones, proporcionando un fuerte apoyo para una comprensión profunda de las complejas relaciones en el campo legal.
Descripción
El conocimiento legal implica un conocimiento heterogéneo multidimensional, como disposiciones legales, interpretaciones judiciales, casos judiciales y defensas, lo que requiere una relevancia y precisión extremadamente altas del conocimiento. Mientras tanto, la construcción de un sistema de razonamiento de conocimiento legal también enfrenta desafíos en la obtención, procesamiento y compartición de conocimiento heterogéneo de múltiples fuentes. La tecnología de grafos de conocimiento, que es una forma de organización del conocimiento con triples como unidad básica, puede transformar de manera eficiente la información heterogénea de múltiples fuentes en una forma de representación del conocimiento cercana a la cognición humana. Tomando la construcción automatizada del grafo de conocimiento legal chino (CLKG) como un escenario de caso, este documento presenta un modelo conjunto de mejora del conocimiento (JKEM), donde el conocimiento previo se incorpora en un modelo de lenguaje grande (LLM), y el LLM se ajusta finamente a través del prefijo de los datos de conocimiento previo. Bajo la condición de congelar la mayoría de los parámetros del LLM, este esquema de ajuste fino añade indicaciones profundas continuas como tokens de prefijo a las secuencias de entrada de diferentes capas, lo que puede mejorar significativamente la precisión de la extracción de conocimiento. Los resultados muestran que la precisión de extracción de conocimiento del JKEM en este documento alcanza el 90.92%. Basado en el rendimiento superior de este modelo, el CLKG se construye aún más, que contiene 3480 triples de conocimiento compuestos por 9 entidades y 2 relaciones, proporcionando un fuerte apoyo para una comprensión profunda de las complejas relaciones en el campo legal.