Mejorando la Sostenibilidad del Software: Aprovechando Modelos de Lenguaje Grande para Evaluar el Cumplimiento de los Requisitos de Seguridad en la Ingeniería de Requisitos
Autores: Subahi, Ahmad F.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Mejorando la Sostenibilidad del Software: Aprovechando Modelos de Lenguaje Grande para Evaluar el Cumplimiento de los Requisitos de Seguridad en la Ingeniería de Requisitos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Ciberseguridad
Sistemas de software
NFRs
Aprendizaje automático
Tareas de clasificación
NFRs relacionadas con la seguridad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
En la era digital, la ciberseguridad es integral para preservar la seguridad nacional, la privacidad digital y la sostenibilidad social. Esta investigación enfatiza el papel de los requisitos no funcionales (NFR) en el desarrollo de sistemas de software seguros que mejoran el bienestar social al garantizar la protección de datos, la privacidad del usuario y la robustez del sistema. Específicamente, este estudio introduce un enfoque de prueba de concepto aprovechando modelos de aprendizaje automático (ML) para clasificar los NFR e identificar problemas relacionados con la seguridad en las primeras etapas del ciclo de vida del desarrollo de software. Se realizaron dos experimentos para evaluar la efectividad de diferentes modelos para tareas de clasificación binaria y multiclase. En el Experimento 1, se ajustaron modelos basados en BERT y redes neuronales artificiales (ANN) para clasificar los NFR en categorías de seguridad y no seguridad utilizando un conjunto de datos de 803 declaraciones. Los modelos basados en BERT superaron a las ANN, logrando una mayor precisión, exactitud, recuperación y puntuaciones ROC-AUC, con el ajuste de hiperparámetros mejorando aún más los resultados. El Experimento 2 evaluó la regresión logística (LR), una máquina de soporte vectorial (SVM) y XGBoost para la clasificación multiclase de NFR relacionados con la seguridad en siete categorías. El SVM y XGBoost mostraron un rendimiento sólido, logrando alta precisión y recuperación en categorías específicas. Los hallazgos demuestran la efectividad de los modelos avanzados de ML en la automatización de la clasificación de NFR, mejorando la seguridad del software y apoyando la sostenibilidad social. El trabajo futuro explorará enfoques híbridos para mejorar la escalabilidad y la precisión.
Descripción
En la era digital, la ciberseguridad es integral para preservar la seguridad nacional, la privacidad digital y la sostenibilidad social. Esta investigación enfatiza el papel de los requisitos no funcionales (NFR) en el desarrollo de sistemas de software seguros que mejoran el bienestar social al garantizar la protección de datos, la privacidad del usuario y la robustez del sistema. Específicamente, este estudio introduce un enfoque de prueba de concepto aprovechando modelos de aprendizaje automático (ML) para clasificar los NFR e identificar problemas relacionados con la seguridad en las primeras etapas del ciclo de vida del desarrollo de software. Se realizaron dos experimentos para evaluar la efectividad de diferentes modelos para tareas de clasificación binaria y multiclase. En el Experimento 1, se ajustaron modelos basados en BERT y redes neuronales artificiales (ANN) para clasificar los NFR en categorías de seguridad y no seguridad utilizando un conjunto de datos de 803 declaraciones. Los modelos basados en BERT superaron a las ANN, logrando una mayor precisión, exactitud, recuperación y puntuaciones ROC-AUC, con el ajuste de hiperparámetros mejorando aún más los resultados. El Experimento 2 evaluó la regresión logística (LR), una máquina de soporte vectorial (SVM) y XGBoost para la clasificación multiclase de NFR relacionados con la seguridad en siete categorías. El SVM y XGBoost mostraron un rendimiento sólido, logrando alta precisión y recuperación en categorías específicas. Los hallazgos demuestran la efectividad de los modelos avanzados de ML en la automatización de la clasificación de NFR, mejorando la seguridad del software y apoyando la sostenibilidad social. El trabajo futuro explorará enfoques híbridos para mejorar la escalabilidad y la precisión.