BERT Fine-Tuning para la Clasificación de Requisitos de Software: Impacto de los Componentes del Modelo y del Tamaño del Conjunto de Datos
Autores: Eltahier, Safaa; Dawood, Omer; Saeed, Imtithal
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
BERT Fine-Tuning para la Clasificación de Requisitos de Software: Impacto de los Componentes del Modelo y del Tamaño del Conjunto de Datos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Procesamiento de lenguaje natural
Clasificación de requisitos de software
BERT
Hiperparámetros
Tamaño del conjunto de datos
Ajuste fino.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los avances recientes en el procesamiento del lenguaje natural (NLP) han permitido la automatización de la Clasificación de Requisitos de Software (SRC), particularmente a través del ajuste fino de modelos como las Representaciones de Codificadores Bidireccionales de Transformadores (BERT). Si bien los modelos basados en BERT han mostrado resultados prometedores, el impacto de la sensibilidad a los hiperparámetros y el tamaño del conjunto de datos en el rendimiento de SRC sigue siendo poco explorado. Para abordar esta brecha, presentamos tres contribuciones principales: (1) el desarrollo y evaluación del ajuste fino de BERT para SRC, con énfasis en los efectos de los hiperparámetros clave y el tamaño del conjunto de datos; (2) experimentos exhaustivos para analizar la influencia de los hiperparámetros individuales para identificar configuraciones óptimas para un rendimiento robusto y eficiente; y (3) experimentos controlados que destacan los factores críticos que afectan los resultados del ajuste fino en SRC, particularmente el tamaño del conjunto de datos y la sensibilidad a los hiperparámetros. Nuestro enfoque fue evaluado en dos conjuntos de datos: el conjunto de datos PROMISE y FR_NFR, un conjunto de datos adaptado para la tarea de SRC. El método propuesto superó a los modelos de referencia, logrando una puntuación F1 promedio de 0.99 en PROMISE y 0.97 en FR_NFR. Estos hallazgos proporcionan evidencia empírica sobre estrategias de optimización para la clasificación de requisitos basada en BERT y ofrecen orientación práctica a los profesionales de la ingeniería de software.
Descripción
Los avances recientes en el procesamiento del lenguaje natural (NLP) han permitido la automatización de la Clasificación de Requisitos de Software (SRC), particularmente a través del ajuste fino de modelos como las Representaciones de Codificadores Bidireccionales de Transformadores (BERT). Si bien los modelos basados en BERT han mostrado resultados prometedores, el impacto de la sensibilidad a los hiperparámetros y el tamaño del conjunto de datos en el rendimiento de SRC sigue siendo poco explorado. Para abordar esta brecha, presentamos tres contribuciones principales: (1) el desarrollo y evaluación del ajuste fino de BERT para SRC, con énfasis en los efectos de los hiperparámetros clave y el tamaño del conjunto de datos; (2) experimentos exhaustivos para analizar la influencia de los hiperparámetros individuales para identificar configuraciones óptimas para un rendimiento robusto y eficiente; y (3) experimentos controlados que destacan los factores críticos que afectan los resultados del ajuste fino en SRC, particularmente el tamaño del conjunto de datos y la sensibilidad a los hiperparámetros. Nuestro enfoque fue evaluado en dos conjuntos de datos: el conjunto de datos PROMISE y FR_NFR, un conjunto de datos adaptado para la tarea de SRC. El método propuesto superó a los modelos de referencia, logrando una puntuación F1 promedio de 0.99 en PROMISE y 0.97 en FR_NFR. Estos hallazgos proporcionan evidencia empírica sobre estrategias de optimización para la clasificación de requisitos basada en BERT y ofrecen orientación práctica a los profesionales de la ingeniería de software.