logo móvil
Contáctanos

Análisis empírico de clasificadores de bosques de decisión basados en muestreo de datos para la predicción de defectos en software

Autores: Usman-Hamza, Fatima Enehezei; Balogun, Abdullateef Oluwagbemiga; Mamman, Hussaini; Capretz, Luiz Fernando; Basri, Shuib; Oyekunle, Rafiat Ajibade; Mojeed, Hammed Adeleye; Akintola, Abimbola Ganiyat

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Análisis empírico de clasificadores de bosques de decisión basados en muestreo de datos para la predicción de defectos en software


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Pruebas de software
Defectos
Predicción de defectos de software
Aprendizaje automático
Modelos de bosques de decisión
Desequilibrio de clases

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 32

Citaciones: Sin citaciones


Descripción
La importancia estratégica de las pruebas de software para garantizar el éxito de los proyectos de desarrollo de software es fundamental. Las pruebas exhaustivas, realizadas de manera temprana y constante a lo largo del ciclo de vida del desarrollo, son vitales para mitigar defectos, especialmente dadas las limitaciones de tiempo, presupuesto y otros recursos que a menudo enfrentan los equipos de desarrollo. La predicción de defectos de software (SDP) sirve como un enfoque proactivo para identificar los componentes de software que tienen más probabilidades de ser defectuosos. Al predecir estos módulos de alto riesgo, los equipos pueden priorizar pruebas e inspecciones exhaustivas, evitando así que los defectos escalen a etapas posteriores donde la resolución se vuelve más intensiva en recursos. Los modelos de SDP deben ser continuamente refinados para mejorar la precisión y el rendimiento predictivo. Esto implica integrar conjuntos de datos limpios y preprocesados, aprovechar métodos avanzados de aprendizaje automático (ML) y optimizar métricas clave. Los enfoques basados en estadísticas y los modelos de ML tradicionales han sido ampliamente explorados para SDP. Sin embargo, los modelos basados en estadísticas a menudo tienen dificultades con la escalabilidad y la robustez, mientras que los modelos de ML convencionales enfrentan desafíos con conjuntos de datos desbalanceados, limitando su eficacia predictiva. En este estudio, se desarrollaron modelos innovadores de bosque de decisiones (DF) para abordar estas limitaciones. Específicamente, este estudio evalúa el bosque sensible al costo (CS-Forest), el bosque que penaliza atributos (FPA) y los árboles funcionales (FT) como modelos DF. Estos modelos se mejoraron aún más utilizando técnicas de conjunto homogéneas, como técnicas de bagging y boosting. El análisis experimental en conjuntos de datos de SDP de referencia demuestra que los modelos DF propuestos manejan eficazmente el desbalance de clases, distinguiendo con precisión entre módulos defectuosos y no defectuosos. En comparación con métodos de ML y aprendizaje profundo (DL) de referencia y de última generación, los modelos DF sugeridos exhiben un rendimiento predictivo superior y ofrecen soluciones escalables para SDP. En consecuencia, se recomienda la aplicación de modelos basados en DF para avanzar en la predicción de defectos en la ingeniería de software y en dominios similares de ML.

Otros recursos que podrían interesarte

Temas Virtualpro