logo móvil
Contáctanos

Aprendizaje Activo Profundo para Predicción de Refactorización Eficiente en Etiquetas

Autores: Alameer, Abdulmajeed; Alazba, Amal

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Aprendizaje Activo Profundo para Predicción de Refactorización Eficiente en Etiquetas


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Refactorización de software
Mantenibilidad
Deuda técnica
Aprendizaje activo profundo
Clasificador neuronal
Predicción de refactorización

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La refactorización de software mejora la mantenibilidad del código y reduce la deuda técnica, pero la construcción de un conjunto de datos de refactorización etiquetado es un proceso costoso y laborioso. Para hacer que la predicción de refactorización sea más implementable bajo presupuestos de anotación limitados, este documento introduce un pipeline de Aprendizaje Activo Profundo (DAL) que entrena iterativamente un clasificador neuronal profundo en representaciones de métricas de software y consulta selectivamente etiquetas para las entidades no etiquetadas más informativas. Nuestro enfoque propuesto se evalúa en un entorno basado en un conjunto de datos de refactorización a nivel de clase, método y variable (múltiples tipos de refactorización) utilizando un protocolo de entrenamiento consistente y un amplio conjunto de estrategias de consulta. Los resultados muestran que DAL puede recuperar casi la efectividad de datos completos con sustancialmente menos etiquetas: en promedio, alcanzar el rendimiento objetivo requiere un 11.4% de datos etiquetados para refactorizaciones a nivel de clase, un 25.0% para refactorizaciones a nivel de método y un 20.0% para refactorizaciones a nivel de variable, lo que corresponde a aproximadamente un 75-89% de ahorro en etiquetado, demostrando una mejor eficiencia de datos para la predicción de refactorización. Además, las estrategias basadas en la incertidumbre y mejoradas por dropout fueron las estrategias de consulta más efectivas de manera consistente a través de los tipos de refactorización y los presupuestos de etiquetado.

Otros recursos que podrían interesarte

Temas Virtualpro