LLM-ACNC: Construcción de un Grafo de Conocimiento de Textos de Requisitos Aeroespaciales Utilizando un Modelo de Lenguaje Grande
Autores: Liu, Yuhao; Hou, Junjie; Chen, Yuxuan; Jin, Jie; Wang, Wenyue
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
LLM-ACNC: Construcción de un Grafo de Conocimiento de Textos de Requisitos Aeroespaciales Utilizando un Modelo de Lenguaje Grande
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Métodos tradicionales
Identificación de requisitos
Gráficos de conocimiento
Aeroespacial
Modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
Los métodos tradicionales para la identificación de requisitos dependen de la transformación manual de textos de requisitos no estructurados en documentos formales, un proceso que es tanto ineficiente como propenso a errores. Aunque los gráficos de conocimiento de requisitos ofrecen representaciones estructuradas, las técnicas actuales de reconocimiento de entidades nombradas y extracción de relaciones continúan enfrentando desafíos significativos en el procesamiento de la terminología especializada y las complejas estructuras de oraciones características del dominio aeroespacial. Para superar estas limitaciones, este estudio introduce un enfoque novedoso para construir gráficos de conocimiento de requisitos específicos del sector aeroespacial utilizando un modelo de lenguaje grande. El método primero emplea el modelo GPT para la augmentación de datos, seguido de un filtrado con BERTScore para asegurar la calidad y consistencia de los datos. Luego se implementa un aprendizaje continuo eficiente basado en la codificación de índices de tokens, guiando al modelo para centrarse en la información clave y mejorando la adaptabilidad al dominio a través del ajuste fino del modelo Qwen2.5 (7B). Además, se establece un marco de razonamiento en cadena de pensamiento para mejorar el reconocimiento de entidades y relaciones, junto con una estrategia dinámica de aprendizaje de pocos ejemplos que selecciona ejemplos de manera adaptativa según las características de entrada. Los resultados experimentales validan la efectividad del método propuesto, logrando puntuaciones F1 del 88.75% en tareas de NER y del 89.48% en tareas de extracción de relaciones.
Descripción
Los métodos tradicionales para la identificación de requisitos dependen de la transformación manual de textos de requisitos no estructurados en documentos formales, un proceso que es tanto ineficiente como propenso a errores. Aunque los gráficos de conocimiento de requisitos ofrecen representaciones estructuradas, las técnicas actuales de reconocimiento de entidades nombradas y extracción de relaciones continúan enfrentando desafíos significativos en el procesamiento de la terminología especializada y las complejas estructuras de oraciones características del dominio aeroespacial. Para superar estas limitaciones, este estudio introduce un enfoque novedoso para construir gráficos de conocimiento de requisitos específicos del sector aeroespacial utilizando un modelo de lenguaje grande. El método primero emplea el modelo GPT para la augmentación de datos, seguido de un filtrado con BERTScore para asegurar la calidad y consistencia de los datos. Luego se implementa un aprendizaje continuo eficiente basado en la codificación de índices de tokens, guiando al modelo para centrarse en la información clave y mejorando la adaptabilidad al dominio a través del ajuste fino del modelo Qwen2.5 (7B). Además, se establece un marco de razonamiento en cadena de pensamiento para mejorar el reconocimiento de entidades y relaciones, junto con una estrategia dinámica de aprendizaje de pocos ejemplos que selecciona ejemplos de manera adaptativa según las características de entrada. Los resultados experimentales validan la efectividad del método propuesto, logrando puntuaciones F1 del 88.75% en tareas de NER y del 89.48% en tareas de extracción de relaciones.