Un Nuevo Marco para Detectar Requisitos de Software Irrelevantes Basado en MultiPhiLDA como el Modelo de Tema
Autores: Siahaan, Daniel; Darnoto, Brian Rizqi Paradisiaca
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un Nuevo Marco para Detectar Requisitos de Software Irrelevantes Basado en MultiPhiLDA como el Modelo de Tema
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Requisitos
Desarrollo de software
Ruido
SRS
Detección de valores atípicos
Marco
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El ruido en los requisitos se ha conocido como un defecto en las especificaciones de requisitos de software (SRS). Detectar defectos en una etapa temprana es crucial en el proceso de desarrollo de software. El ruido puede presentarse en forma de requisitos irrelevantes que se incluyen dentro de un SRS. Un estudio anterior había intentado detectar ruido en SRS, en el cual el ruido se consideraba como un valor atípico. Sin embargo, el método resultante solo demostró una fiabilidad moderada debido a la opacidad de las palabras únicas de los actores por las palabras únicas de acción en la distribución de palabras temáticas. En este estudio, proponemos un marco para identificar requisitos irrelevantes basado en el método MultiPhiLDA. El marco propuesto distingue la distribución de palabras temáticas de las palabras de los actores y las palabras de acción como dos distribuciones de palabras temáticas separadas con dos funciones de probabilidad multinomial. Se utilizan pesos para mantener una contribución proporcional de las palabras de los actores y las palabras de acción. También exploramos el uso de dos métodos de detección de valores atípicos, a saber, la detección de valores atípicos basada en percentiles (PBOD) y la detección de valores atípicos basada en ángulos (ABOD), para distinguir requisitos irrelevantes de requisitos relevantes. Los resultados experimentales muestran que el marco propuesto pudo exhibir un mejor rendimiento que los métodos anteriores. Además, el uso de la combinación de ABOD como método de detección de valores atípicos y la coherencia temática como enfoque de estimación para determinar el número óptimo de temas e iteraciones en el marco propuesto superó a las otras combinaciones y obtuvo valores de sensibilidad, especificidad, F1-score y G-mean de 0.59, 0.65, 0.62 y 0.62, respectivamente.
Descripción
El ruido en los requisitos se ha conocido como un defecto en las especificaciones de requisitos de software (SRS). Detectar defectos en una etapa temprana es crucial en el proceso de desarrollo de software. El ruido puede presentarse en forma de requisitos irrelevantes que se incluyen dentro de un SRS. Un estudio anterior había intentado detectar ruido en SRS, en el cual el ruido se consideraba como un valor atípico. Sin embargo, el método resultante solo demostró una fiabilidad moderada debido a la opacidad de las palabras únicas de los actores por las palabras únicas de acción en la distribución de palabras temáticas. En este estudio, proponemos un marco para identificar requisitos irrelevantes basado en el método MultiPhiLDA. El marco propuesto distingue la distribución de palabras temáticas de las palabras de los actores y las palabras de acción como dos distribuciones de palabras temáticas separadas con dos funciones de probabilidad multinomial. Se utilizan pesos para mantener una contribución proporcional de las palabras de los actores y las palabras de acción. También exploramos el uso de dos métodos de detección de valores atípicos, a saber, la detección de valores atípicos basada en percentiles (PBOD) y la detección de valores atípicos basada en ángulos (ABOD), para distinguir requisitos irrelevantes de requisitos relevantes. Los resultados experimentales muestran que el marco propuesto pudo exhibir un mejor rendimiento que los métodos anteriores. Además, el uso de la combinación de ABOD como método de detección de valores atípicos y la coherencia temática como enfoque de estimación para determinar el número óptimo de temas e iteraciones en el marco propuesto superó a las otras combinaciones y obtuvo valores de sensibilidad, especificidad, F1-score y G-mean de 0.59, 0.65, 0.62 y 0.62, respectivamente.