Metodología Ágil para la Estandarización de Requisitos de Ingeniería Utilizando Modelos de Lenguaje Grande
Autores: Tikayat Ray, Archana; Cole, Bjorn F.; Pinon Fischer, Olivia J.; Bhat, Anirudh Prabhakara; White, Ryan T.; Mavris, Dimitri N.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Metodología Ágil para la Estandarización de Requisitos de Ingeniería Utilizando Modelos de Lenguaje Grande
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Sistemas modernos
Ingeniería de Sistemas Basada en Modelos
Lenguaje Natural
Modelos de Lenguaje Grande
Procesamiento de Lenguaje Natural
Requisitos legibles por máquina
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La creciente complejidad de los sistemas modernos está exigiendo un enfoque integrado y completo para el diseño y desarrollo de sistemas y, en particular, un cambio hacia enfoques de Ingeniería de Sistemas Basada en Modelos (MBSE) para el diseño de sistemas. Los requisitos que sirven como base para estos sistemas intrincados todavía se expresan principalmente en Lenguaje Natural (NL), que puede contener ambigüedades e inconsistencias y sufrir de una falta de estructura que dificulta su traducción directa a modelos. Los enormes desarrollos en el campo del Procesamiento de Lenguaje Natural (NLP), en general, y de los Modelos de Lenguaje Grande (LLMs), en particular, pueden servir como un facilitador para la conversión de requisitos en NL a requisitos legibles por máquina. Se espera que hacerlo facilite su estandarización y uso en un entorno basado en modelos. Este documento discute una estrategia de dos vías para convertir requisitos en NL en requisitos legibles por máquina utilizando modelos de lenguaje. El primer enfoque implica crear una tabla de requisitos extrayendo información de requisitos en NL de forma libre. El segundo enfoque consiste en una metodología ágil que facilita la identificación de plantillas estándar para diferentes tipos de requisitos basados en patrones lingüísticos observados. Para este estudio, se utilizan tres LLMs diferentes. Dos de estos modelos son versiones ajustadas de Representaciones de Codificadores Bidireccionales de Transformadores (BERTs), específicamente, aeroBERT-NER y aeroBERT-Classifier, que están entrenados en corpora aeroespaciales anotados. Otro LLM, llamado flair/chunk-english, se utiliza para identificar fragmentos de oraciones presentes en los requisitos en NL. Los tres modelos de lenguaje se utilizan juntos para lograr la estandarización de requisitos. La efectividad de las metodologías se demuestra a través de la creación semi-automatizada de plantillas para requisitos de las Partes 23 y 25 del Título 14 del Código de Regulaciones Federales (CFRs).
Descripción
La creciente complejidad de los sistemas modernos está exigiendo un enfoque integrado y completo para el diseño y desarrollo de sistemas y, en particular, un cambio hacia enfoques de Ingeniería de Sistemas Basada en Modelos (MBSE) para el diseño de sistemas. Los requisitos que sirven como base para estos sistemas intrincados todavía se expresan principalmente en Lenguaje Natural (NL), que puede contener ambigüedades e inconsistencias y sufrir de una falta de estructura que dificulta su traducción directa a modelos. Los enormes desarrollos en el campo del Procesamiento de Lenguaje Natural (NLP), en general, y de los Modelos de Lenguaje Grande (LLMs), en particular, pueden servir como un facilitador para la conversión de requisitos en NL a requisitos legibles por máquina. Se espera que hacerlo facilite su estandarización y uso en un entorno basado en modelos. Este documento discute una estrategia de dos vías para convertir requisitos en NL en requisitos legibles por máquina utilizando modelos de lenguaje. El primer enfoque implica crear una tabla de requisitos extrayendo información de requisitos en NL de forma libre. El segundo enfoque consiste en una metodología ágil que facilita la identificación de plantillas estándar para diferentes tipos de requisitos basados en patrones lingüísticos observados. Para este estudio, se utilizan tres LLMs diferentes. Dos de estos modelos son versiones ajustadas de Representaciones de Codificadores Bidireccionales de Transformadores (BERTs), específicamente, aeroBERT-NER y aeroBERT-Classifier, que están entrenados en corpora aeroespaciales anotados. Otro LLM, llamado flair/chunk-english, se utiliza para identificar fragmentos de oraciones presentes en los requisitos en NL. Los tres modelos de lenguaje se utilizan juntos para lograr la estandarización de requisitos. La efectividad de las metodologías se demuestra a través de la creación semi-automatizada de plantillas para requisitos de las Partes 23 y 25 del Título 14 del Código de Regulaciones Federales (CFRs).