Generación de Pseudocódigo de Transformador Basada en Recuperación
Autores: Alokla, Anas; Gad, Walaa; Nazih, Waleed; Aref, Mustafa; Salem, Abdel-Badeeh
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Generación de Pseudocódigo de Transformador Basada en Recuperación
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Código fuente
Pseudocódigo
Modelo
Recuperación
Transformador
Rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La comprensión del código fuente es muy difícil, especialmente si el programador no está familiarizado con el lenguaje de programación. El pseudocódigo explica y describe el contenido del código basado en el análisis semántico y la comprensión del código fuente. En este documento, se propone un nuevo modelo de generación de pseudocódigo basado en la recuperación de transformadores. El modelo propuesto adopta diferentes métodos de similitud de recuperación y traducción automática neuronal para generar pseudocódigo. El modelo propuesto maneja palabras de baja frecuencia y palabras que no existen en el conjunto de datos de entrenamiento. Consta de tres pasos. Primero, recuperamos las oraciones similares a la oración de entrada utilizando diferentes métodos de similitud. En segundo lugar, pasamos el código fuente recuperado (entrada recuperada) al modelo de aprendizaje profundo basado en el transformador para generar el pseudocódigo recuperado. En tercer lugar, se realiza el proceso de reemplazo para obtener el pseudocódigo objetivo. El modelo propuesto se evalúa utilizando conjuntos de datos de Django y SPoC. Los experimentos muestran resultados de rendimiento prometedores en comparación con otros modelos de lenguaje de traducción automática. Alcanza 61.96 y 50.28 en términos de medidas de rendimiento BLEU para Django y SPoC, respectivamente.
Descripción
La comprensión del código fuente es muy difícil, especialmente si el programador no está familiarizado con el lenguaje de programación. El pseudocódigo explica y describe el contenido del código basado en el análisis semántico y la comprensión del código fuente. En este documento, se propone un nuevo modelo de generación de pseudocódigo basado en la recuperación de transformadores. El modelo propuesto adopta diferentes métodos de similitud de recuperación y traducción automática neuronal para generar pseudocódigo. El modelo propuesto maneja palabras de baja frecuencia y palabras que no existen en el conjunto de datos de entrenamiento. Consta de tres pasos. Primero, recuperamos las oraciones similares a la oración de entrada utilizando diferentes métodos de similitud. En segundo lugar, pasamos el código fuente recuperado (entrada recuperada) al modelo de aprendizaje profundo basado en el transformador para generar el pseudocódigo recuperado. En tercer lugar, se realiza el proceso de reemplazo para obtener el pseudocódigo objetivo. El modelo propuesto se evalúa utilizando conjuntos de datos de Django y SPoC. Los experimentos muestran resultados de rendimiento prometedores en comparación con otros modelos de lenguaje de traducción automática. Alcanza 61.96 y 50.28 en términos de medidas de rendimiento BLEU para Django y SPoC, respectivamente.