logo móvil
Contáctanos

La Detección y Resolución Escalable de Grupos de Datos Usando un Pipeline Modular con ChatGPT

Autores: Baumgartner, Nils; Iyenghar, Padma; Schoemaker, Timo; Pulvermüller, Elke

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

La Detección y Resolución Escalable de Grupos de Datos Usando un Pipeline Modular con ChatGPT


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Tubería
ChatGPT
Grupos de datos
Refactorización
Mantenibilidad del software
LLM

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 27

Citaciones: Sin citaciones


Descripción
Este documento explora una arquitectura de pipeline modular que integra ChatGPT, un Modelo de Lenguaje Grande (LLM), para automatizar la detección y refactorización de agrupaciones de datos, un tipo de olor de código prevalente que complica la mantenibilidad del software. Las agrupaciones de datos se refieren a grupos de código que a menudo se repiten y que idealmente deberían ser refactorizados para mejorar la calidad del código. El pipeline aprovecha las capacidades de ChatGPT para entender el contexto y generar salidas estructuradas, lo que lo hace adecuado para abordar tareas complejas de refactorización de software. A través de experimentación sistemática, nuestro estudio no solo aborda las preguntas de investigación planteadas, sino que también demuestra que el pipeline puede identificar con precisión las agrupaciones de datos, destacándose especialmente en casos que requieren comprensión semántica, donde las agrupaciones localizadas están incrustadas dentro de bases de código más grandes. Si bien la solución mejora significativamente el flujo de trabajo de refactorización, facilitando la gestión de agrupaciones distribuidas a través de múltiples archivos, también presenta desafíos como errores ocasionales del compilador y altos costos computacionales. Los comentarios de los desarrolladores subrayan la utilidad de los LLM en el desarrollo de software, pero también destacan el papel esencial de la supervisión humana para corregir inexactitudes. Estos hallazgos demuestran el potencial del pipeline para mejorar la mantenibilidad del software, ofreciendo una solución escalable y eficiente para abordar los olores de código en proyectos del mundo real, y contribuyendo al objetivo más amplio de mejorar la mantenibilidad del software en proyectos a gran escala.

Otros recursos que podrían interesarte

Temas Virtualpro