Un enfoque de representación de código fuente novel basado en atención multi-cabeza
Autores: Xiao, Lei; Zhong, Hao; Liu, Jianjian; Zhang, Kaiyu; Xu, Qizhen; Chang, Le
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un enfoque de representación de código fuente novel basado en atención multi-cabeza
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Clasificación de código
Detección de clones de código
Aprendizaje profundo
Método de representación de código fuente
Mecanismo de atención multi-cabeza
Complejidad computacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
La clasificación de código y la detección de clones de código son cruciales para comprender y mantener sistemas de software grandes. Aunque el aprendizaje profundo supera a las técnicas tradicionales en la captura de las características del código fuente, los modelos existentes sufren de baja potencia de procesamiento y alta complejidad. Proponemos un nuevo método de representación de código fuente basado en el mecanismo de atención de múltiples cabezas (SCRMHA). SCRMHA captura la representación vectorial de segmentos de código completos, lo que le permite enfocarse en diferentes posiciones de la secuencia de entrada, capturar información semántica más rica y procesar simultáneamente diferentes aspectos y relaciones de la secuencia. Además, puede calcular múltiples cabezas de atención en paralelo, acelerando el proceso computacional. Evaluamos SCRMHA tanto en el conjunto de datos estándar como en un conjunto de datos industrial real, y analizamos las diferencias entre estos dos conjuntos de datos. Los resultados experimentales en tareas de clasificación de código y detección de clones muestran que SCRMHA consume menos tiempo y reduce la complejidad en aproximadamente un tercio en comparación con los métodos tradicionales de representación de características de código fuente. Los resultados demuestran que SCRMHA reduce la complejidad computacional y el tiempo de consumo del modelo manteniendo la precisión.
Descripción
La clasificación de código y la detección de clones de código son cruciales para comprender y mantener sistemas de software grandes. Aunque el aprendizaje profundo supera a las técnicas tradicionales en la captura de las características del código fuente, los modelos existentes sufren de baja potencia de procesamiento y alta complejidad. Proponemos un nuevo método de representación de código fuente basado en el mecanismo de atención de múltiples cabezas (SCRMHA). SCRMHA captura la representación vectorial de segmentos de código completos, lo que le permite enfocarse en diferentes posiciones de la secuencia de entrada, capturar información semántica más rica y procesar simultáneamente diferentes aspectos y relaciones de la secuencia. Además, puede calcular múltiples cabezas de atención en paralelo, acelerando el proceso computacional. Evaluamos SCRMHA tanto en el conjunto de datos estándar como en un conjunto de datos industrial real, y analizamos las diferencias entre estos dos conjuntos de datos. Los resultados experimentales en tareas de clasificación de código y detección de clones muestran que SCRMHA consume menos tiempo y reduce la complejidad en aproximadamente un tercio en comparación con los métodos tradicionales de representación de características de código fuente. Los resultados demuestran que SCRMHA reduce la complejidad computacional y el tiempo de consumo del modelo manteniendo la precisión.