Aprendizaje Activo Profundo para Predicción de Refactorización Eficiente en Etiquetas
Autores: Alameer, Abdulmajeed; Alazba, Amal
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Aprendizaje Activo Profundo para Predicción de Refactorización Eficiente en Etiquetas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Refactorización de software
Mantenibilidad
Deuda técnica
Aprendizaje activo profundo
Clasificador neuronal
Predicción de refactorización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La refactorización de software mejora la mantenibilidad del código y reduce la deuda técnica, pero la construcción de un conjunto de datos de refactorización etiquetado es un proceso costoso y laborioso. Para hacer que la predicción de refactorización sea más implementable bajo presupuestos de anotación limitados, este documento introduce un pipeline de Aprendizaje Activo Profundo (DAL) que entrena iterativamente un clasificador neuronal profundo en representaciones de métricas de software y consulta selectivamente etiquetas para las entidades no etiquetadas más informativas. Nuestro enfoque propuesto se evalúa en un entorno basado en un conjunto de datos de refactorización a nivel de clase, método y variable (múltiples tipos de refactorización) utilizando un protocolo de entrenamiento consistente y un amplio conjunto de estrategias de consulta. Los resultados muestran que DAL puede recuperar casi la efectividad de datos completos con sustancialmente menos etiquetas: en promedio, alcanzar el rendimiento objetivo requiere un 11.4% de datos etiquetados para refactorizaciones a nivel de clase, un 25.0% para refactorizaciones a nivel de método y un 20.0% para refactorizaciones a nivel de variable, lo que corresponde a aproximadamente un 75-89% de ahorro en etiquetado, demostrando una mejor eficiencia de datos para la predicción de refactorización. Además, las estrategias basadas en la incertidumbre y mejoradas por dropout fueron las estrategias de consulta más efectivas de manera consistente a través de los tipos de refactorización y los presupuestos de etiquetado.
Descripción
La refactorización de software mejora la mantenibilidad del código y reduce la deuda técnica, pero la construcción de un conjunto de datos de refactorización etiquetado es un proceso costoso y laborioso. Para hacer que la predicción de refactorización sea más implementable bajo presupuestos de anotación limitados, este documento introduce un pipeline de Aprendizaje Activo Profundo (DAL) que entrena iterativamente un clasificador neuronal profundo en representaciones de métricas de software y consulta selectivamente etiquetas para las entidades no etiquetadas más informativas. Nuestro enfoque propuesto se evalúa en un entorno basado en un conjunto de datos de refactorización a nivel de clase, método y variable (múltiples tipos de refactorización) utilizando un protocolo de entrenamiento consistente y un amplio conjunto de estrategias de consulta. Los resultados muestran que DAL puede recuperar casi la efectividad de datos completos con sustancialmente menos etiquetas: en promedio, alcanzar el rendimiento objetivo requiere un 11.4% de datos etiquetados para refactorizaciones a nivel de clase, un 25.0% para refactorizaciones a nivel de método y un 20.0% para refactorizaciones a nivel de variable, lo que corresponde a aproximadamente un 75-89% de ahorro en etiquetado, demostrando una mejor eficiencia de datos para la predicción de refactorización. Además, las estrategias basadas en la incertidumbre y mejoradas por dropout fueron las estrategias de consulta más efectivas de manera consistente a través de los tipos de refactorización y los presupuestos de etiquetado.