Un modelo inteligente basado en XGBoost de múltiples clases para optimizar la predicción de fallos en la integración continua y el despliegue continuo de DevOps
Autores: Al-Baltah, Ibrahim Ahmed; Al-Shaibany, Nagi; Abdellatief, Majdi; Al-Gawda, Mohammed M.; Al-Sultan, Sultan Yahya
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un modelo inteligente basado en XGBoost de múltiples clases para optimizar la predicción de fallos en la integración continua y el despliegue continuo de DevOps
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Desarrollo de software
Metodologías ágiles
Prácticas de DevOps
Integración continua
Despliegue continuo
Modelo basado en XGBoost
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El desarrollo de software moderno se basa fundamentalmente en metodologías ágiles y prácticas de DevOps para facilitar la entrega acelerada de software. La integración continua y el despliegue continuo (CI/CD) son algunas de las prácticas de DevOps más críticas que requieren una atención considerable para ejecutarse con éxito. Por lo tanto, este estudio propone un modelo basado en XGBoost de múltiples clases para mejorar el rendimiento de la predicción de fallos en CI/CD. El modelo propuesto fue entrenado y probado utilizando el completo conjunto de datos de TravisTorrent, que contiene información extensa sobre compilaciones de varios proyectos desarrollados en diversos lenguajes de programación. Los resultados experimentales demuestran que el modelo propuesto logra una mejora de rendimiento estadísticamente significativa de casi el 18% sobre los modelos SVM y Random Forest. Más allá de la mejora en el rendimiento, se empleó el análisis SHAP (SHapley Additive exPlanations) para explicar el proceso de toma de decisiones del modelo, revelando que las características más influyentes, clasificadas en orden descendente de importancia, son el estado del registro de compilación, la duración de la compilación, la hora de inicio de la compilación, el número de commits en el repositorio y la antigüedad del repositorio. Esta interpretabilidad mejora tanto la fiabilidad como la transparencia del modelo propuesto.
Descripción
El desarrollo de software moderno se basa fundamentalmente en metodologías ágiles y prácticas de DevOps para facilitar la entrega acelerada de software. La integración continua y el despliegue continuo (CI/CD) son algunas de las prácticas de DevOps más críticas que requieren una atención considerable para ejecutarse con éxito. Por lo tanto, este estudio propone un modelo basado en XGBoost de múltiples clases para mejorar el rendimiento de la predicción de fallos en CI/CD. El modelo propuesto fue entrenado y probado utilizando el completo conjunto de datos de TravisTorrent, que contiene información extensa sobre compilaciones de varios proyectos desarrollados en diversos lenguajes de programación. Los resultados experimentales demuestran que el modelo propuesto logra una mejora de rendimiento estadísticamente significativa de casi el 18% sobre los modelos SVM y Random Forest. Más allá de la mejora en el rendimiento, se empleó el análisis SHAP (SHapley Additive exPlanations) para explicar el proceso de toma de decisiones del modelo, revelando que las características más influyentes, clasificadas en orden descendente de importancia, son el estado del registro de compilación, la duración de la compilación, la hora de inicio de la compilación, el número de commits en el repositorio y la antigüedad del repositorio. Esta interpretabilidad mejora tanto la fiabilidad como la transparencia del modelo propuesto.