Declaración de jerarquía granular mejorada de resumen de código
Autores: Zhang, Qianjin; Jin, Dahai; Wang, Yawen; Gong, Yunzhan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Declaración de jerarquía granular mejorada de resumen de código
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Resumen de código
Desarrolladores
Comprensión de programas
Descripciones textuales
Código fuente
Características jerárquicas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
La sumarización de código juega un papel vital en ayudar a los desarrolladores con la comprensión de programas al generar descripciones textuales correspondientes para fragmentos de código. Mientras que enfoques recientes se han concentrado en codificar las características textuales y estructurales del código fuente, a menudo descuidan las características jerárquicas globales, lo que provoca una representación limitada del código. Abordando esta brecha, nuestro artículo presenta el modelo Transformer mejorado con jerarquía a nivel de declaración (SHT), un marco novedoso que integra jerarquía global, sintaxis y secuencias de tokens para generar automáticamente resúmenes para fragmentos de código. SHT está diseñado de manera distintiva con dos codificadores para aprender tanto características jerárquicas como secuenciales del código. Un codificador de atención relacional procesa el gráfico jerárquico a nivel de declaración, produciendo incrustaciones jerárquicas. Posteriormente, otro codificador de secuencia integra estas estructuras jerárquicas con secuencias de tokens. La representación enriquecida resultante se alimenta entonces a un decodificador Transformer convencional, que genera de manera efectiva sumarizaciones concisas e informativas. Nuestros experimentos extensos demuestran que SHT supera significativamente a los enfoques de vanguardia en dos benchmarks de Java ampliamente utilizados. Esto subraya la efectividad de incorporar información jerárquica global para mejorar la calidad de las sumarizaciones de código.
Descripción
La sumarización de código juega un papel vital en ayudar a los desarrolladores con la comprensión de programas al generar descripciones textuales correspondientes para fragmentos de código. Mientras que enfoques recientes se han concentrado en codificar las características textuales y estructurales del código fuente, a menudo descuidan las características jerárquicas globales, lo que provoca una representación limitada del código. Abordando esta brecha, nuestro artículo presenta el modelo Transformer mejorado con jerarquía a nivel de declaración (SHT), un marco novedoso que integra jerarquía global, sintaxis y secuencias de tokens para generar automáticamente resúmenes para fragmentos de código. SHT está diseñado de manera distintiva con dos codificadores para aprender tanto características jerárquicas como secuenciales del código. Un codificador de atención relacional procesa el gráfico jerárquico a nivel de declaración, produciendo incrustaciones jerárquicas. Posteriormente, otro codificador de secuencia integra estas estructuras jerárquicas con secuencias de tokens. La representación enriquecida resultante se alimenta entonces a un decodificador Transformer convencional, que genera de manera efectiva sumarizaciones concisas e informativas. Nuestros experimentos extensos demuestran que SHT supera significativamente a los enfoques de vanguardia en dos benchmarks de Java ampliamente utilizados. Esto subraya la efectividad de incorporar información jerárquica global para mejorar la calidad de las sumarizaciones de código.