logo móvil
Contáctanos

Recuperación de código de fusión multilingüe basada en destilación de conocimientos

Autores: Li, Wen; Xu, Junfei; Chen, Qi

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Recuperación de código de fusión multilingüe basada en destilación de conocimientos


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Recuperación de código semántico
Consultas en lenguaje natural
Recuperación de código
Búsqueda de código en múltiples lenguajes de programación
Destilación de conocimientos
Modelos monolingües

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
La recuperación semántica de código es la tarea de recuperar códigos relevantes basados en consultas en lenguaje natural. Aunque está relacionada con otras tareas de recuperación de información, necesita cerrar las brechas entre el lenguaje utilizado en el código (que suele ser específico de sintaxis y lógica) y el lenguaje natural, que es más adecuado para describir conceptos e ideas ambiguas. Los enfoques existentes estudian la recuperación de código en un lenguaje natural para un lenguaje de programación específico, sin embargo, es engorroso y a menudo requiere una gran cantidad de corpus para cada idioma al tratar con escenarios multilingües. Mediante la destilación de conocimiento de seis Modelos Docentes monolingües existentes para entrenar un Modelo Estudiantil-MPLCS (Búsqueda de Código de Lenguaje de Programación Múltiple), este documento propuso un método para respaldar tareas de búsqueda de código de múltiples lenguajes de programación. MPLCS tiene la capacidad de incorporar varios idiomas en un solo modelo con bajos requisitos de corpus. MPLCS puede estudiar la similitud entre diferentes lenguajes de programación y mejorar la precisión de recuperación para lenguajes de código de conjuntos de datos pequeños. En cuanto a Ruby utilizado en este documento, MPLCS mejoró su puntuación MRR en un 20 a 25%. Además, MPLCS puede compensar la baja precisión de recuperación de los modelos monolingües al realizar trabajos de recuperación de lenguaje en otros lenguajes de programación. Y en algunos casos, la precisión de recuperación de MPLCS puede incluso superar la precisión de recuperación de los modelos monolingües cuando realizan trabajos de recuperación de lenguaje en sí mismos.

Otros recursos que podrían interesarte

Temas Virtualpro