Modelo de Razonamiento Basado en Casos Ponderado por SHAP-Value con Mejora en la Aumento de Datos Mixup para la Estimación del Esfuerzo en Software
Autores: Li, Jing; Zhang, Han; Sun, Shengxiang; Lin, Mingchi; Liu, Sishi; Zhu, Chen; Li, Kai
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Modelo de Razonamiento Basado en Casos Ponderado por SHAP-Value con Mejora en la Aumento de Datos Mixup para la Estimación del Esfuerzo en Software
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Estimación del esfuerzo de software
Razonamiento basado en casos
Marco sinérgico shap-mixup
Aprendizaje de similitud consciente de características
Modelado de distribución de datos
Interpretabilidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La estimación del esfuerzo en software (SEE) sirve como una piedra angular de la gestión efectiva de proyectos de software, y el razonamiento basado en casos (CBR) se destaca como uno de los enfoques más adoptados en este ámbito. Sin embargo, los modelos de SEE basados en CBR todavía enfrentan dos desafíos críticos: los mecanismos convencionales de recuperación de casos carecen de la capacidad para diferenciar la importancia relativa de varias características, y la escasez de datos sigue siendo un obstáculo persistente. Ambos problemas comprometen significativamente la precisión de la estimación y la interpretabilidad de los modelos. Para abordar estas limitaciones, proponemos un marco sinérgico SHAP-Mixup que mejora tanto el aprendizaje de similitud consciente de las características como el modelado de la distribución de datos. Específicamente, introducimos (1) una métrica de similitud ponderada por SHAP consciente de la estabilidad que integra tanto la magnitud como la varianza de las contribuciones de las características para mejorar la robustez de la recuperación, y (2) una estrategia de aumento Mixup consciente de la densidad que genera muestras sintéticas guiadas por la estructura del manifold de datos local en lugar de una interpolación aleatoria. Los resultados experimentales en siete conjuntos de datos de referencia demuestran que el método propuesto reduce el MAE y el MSE en hasta un 20.2% en promedio en comparación con los modelos CBR de referencia, mientras mejora consistentemente Pred(0.25). Además, al mejorar la interpretabilidad del modelo, el método propuesto proporciona a los gerentes de proyectos información útil sobre los principales impulsores del esfuerzo en software, facilitando así una asignación de recursos más informada y eficiente. Basándose en estos hallazgos, este estudio ofrece un camino novedoso y efectivo para desarrollar modelos SEE que sean más precisos, robustos y transparentes.
Descripción
La estimación del esfuerzo en software (SEE) sirve como una piedra angular de la gestión efectiva de proyectos de software, y el razonamiento basado en casos (CBR) se destaca como uno de los enfoques más adoptados en este ámbito. Sin embargo, los modelos de SEE basados en CBR todavía enfrentan dos desafíos críticos: los mecanismos convencionales de recuperación de casos carecen de la capacidad para diferenciar la importancia relativa de varias características, y la escasez de datos sigue siendo un obstáculo persistente. Ambos problemas comprometen significativamente la precisión de la estimación y la interpretabilidad de los modelos. Para abordar estas limitaciones, proponemos un marco sinérgico SHAP-Mixup que mejora tanto el aprendizaje de similitud consciente de las características como el modelado de la distribución de datos. Específicamente, introducimos (1) una métrica de similitud ponderada por SHAP consciente de la estabilidad que integra tanto la magnitud como la varianza de las contribuciones de las características para mejorar la robustez de la recuperación, y (2) una estrategia de aumento Mixup consciente de la densidad que genera muestras sintéticas guiadas por la estructura del manifold de datos local en lugar de una interpolación aleatoria. Los resultados experimentales en siete conjuntos de datos de referencia demuestran que el método propuesto reduce el MAE y el MSE en hasta un 20.2% en promedio en comparación con los modelos CBR de referencia, mientras mejora consistentemente Pred(0.25). Además, al mejorar la interpretabilidad del modelo, el método propuesto proporciona a los gerentes de proyectos información útil sobre los principales impulsores del esfuerzo en software, facilitando así una asignación de recursos más informada y eficiente. Basándose en estos hallazgos, este estudio ofrece un camino novedoso y efectivo para desarrollar modelos SEE que sean más precisos, robustos y transparentes.