Evaluación empírica de técnicas de aprendizaje automático para la predicción de riesgos de requisitos de software
Autores: Naseem, Rashid; Shaukat, Zain; Irfan, Muhammad; Shah, Muhammad Arif; Ahmad, Arshad; Muhammad, Fazal; Glowacz, Adam; Dunai, Larisa; Antonino-Daviu, Jose; Sulaiman, Adel
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Evaluación empírica de técnicas de aprendizaje automático para la predicción de riesgos de requisitos de software
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Predicción de riesgos de software
Ciclo de vida del desarrollo de software
Técnicas de aprendizaje automático
Clasificadores
Métricas de evaluación
Tasas de error
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La predicción de riesgos de software es la actividad más sensible y crucial del Ciclo de Vida del Desarrollo de Software (SDLC). Puede llevar al éxito o al fracaso de un proyecto. El riesgo debe predecirse con antelación para que un proyecto de software sea exitoso. Se propone un modelo para la predicción de riesgos de requerimientos de software utilizando un conjunto de datos de riesgos de requerimientos y técnicas de aprendizaje automático. Además, se realiza una comparación entre múltiples clasificadores como K-Nearest Neighbour (KNN), Average One Dependency Estimator (A1DE), Naïve Bayes (NB), Composite Hypercube on Iterated Random Projection (CHIRP), Decision Table (DT), Decision Table/Naïve Bayes Hybrid Classifier (DTNB), Credal Decision Trees (CDT), Cost-Sensitive Decision Forest (CS-Forest), J48 Decision Tree (J48), y Random Forest (RF) para determinar la técnica más adecuada para el modelo según la naturaleza del conjunto de datos. Estas técnicas se evalúan utilizando varios métricas de evaluación incluyendo CCI (instancias clasificadas correctamente), Error Absoluto Medio (MAE), Error Cuadrático Medio (RMSE), Error Absoluto Relativo (RAE), Error Cuadrático Relativo (RRSE), precisión, sensibilidad, F-measure, Coeficiente de Correlación de Matthew (MCC), Área bajo la Curva de Característica Operativa del Receptor (Área ROC), Área bajo la Curva de Precisión-Recall (Área PRC), y precisión. El resultado inclusivo de este estudio muestra que en términos de reducción de tasas de error, CDT supera a otras técnicas logrando 0.013 para MAE, 0.089 para RMSE, 4.498% para RAE, y 23.741% para RRSE. Sin embargo, en términos de aumento de precisión, DT, DTNB y CDT obtienen mejores resultados.
Descripción
La predicción de riesgos de software es la actividad más sensible y crucial del Ciclo de Vida del Desarrollo de Software (SDLC). Puede llevar al éxito o al fracaso de un proyecto. El riesgo debe predecirse con antelación para que un proyecto de software sea exitoso. Se propone un modelo para la predicción de riesgos de requerimientos de software utilizando un conjunto de datos de riesgos de requerimientos y técnicas de aprendizaje automático. Además, se realiza una comparación entre múltiples clasificadores como K-Nearest Neighbour (KNN), Average One Dependency Estimator (A1DE), Naïve Bayes (NB), Composite Hypercube on Iterated Random Projection (CHIRP), Decision Table (DT), Decision Table/Naïve Bayes Hybrid Classifier (DTNB), Credal Decision Trees (CDT), Cost-Sensitive Decision Forest (CS-Forest), J48 Decision Tree (J48), y Random Forest (RF) para determinar la técnica más adecuada para el modelo según la naturaleza del conjunto de datos. Estas técnicas se evalúan utilizando varios métricas de evaluación incluyendo CCI (instancias clasificadas correctamente), Error Absoluto Medio (MAE), Error Cuadrático Medio (RMSE), Error Absoluto Relativo (RAE), Error Cuadrático Relativo (RRSE), precisión, sensibilidad, F-measure, Coeficiente de Correlación de Matthew (MCC), Área bajo la Curva de Característica Operativa del Receptor (Área ROC), Área bajo la Curva de Precisión-Recall (Área PRC), y precisión. El resultado inclusivo de este estudio muestra que en términos de reducción de tasas de error, CDT supera a otras técnicas logrando 0.013 para MAE, 0.089 para RMSE, 4.498% para RAE, y 23.741% para RRSE. Sin embargo, en términos de aumento de precisión, DT, DTNB y CDT obtienen mejores resultados.