Recuperación de código de fusión multilingüe basada en destilación de conocimientos
Autores: Li, Wen; Xu, Junfei; Chen, Qi
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Recuperación de código de fusión multilingüe basada en destilación de conocimientos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Recuperación de código semántico
Consultas en lenguaje natural
Recuperación de código
Búsqueda de código en múltiples lenguajes de programación
Destilación de conocimientos
Modelos monolingües
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
La recuperación semántica de código es la tarea de recuperar códigos relevantes basados en consultas en lenguaje natural. Aunque está relacionada con otras tareas de recuperación de información, necesita cerrar las brechas entre el lenguaje utilizado en el código (que suele ser específico de sintaxis y lógica) y el lenguaje natural, que es más adecuado para describir conceptos e ideas ambiguas. Los enfoques existentes estudian la recuperación de código en un lenguaje natural para un lenguaje de programación específico, sin embargo, es engorroso y a menudo requiere una gran cantidad de corpus para cada idioma al tratar con escenarios multilingües. Mediante la destilación de conocimiento de seis Modelos Docentes monolingües existentes para entrenar un Modelo Estudiantil-MPLCS (Búsqueda de Código de Lenguaje de Programación Múltiple), este documento propuso un método para respaldar tareas de búsqueda de código de múltiples lenguajes de programación. MPLCS tiene la capacidad de incorporar varios idiomas en un solo modelo con bajos requisitos de corpus. MPLCS puede estudiar la similitud entre diferentes lenguajes de programación y mejorar la precisión de recuperación para lenguajes de código de conjuntos de datos pequeños. En cuanto a Ruby utilizado en este documento, MPLCS mejoró su puntuación MRR en un 20 a 25%. Además, MPLCS puede compensar la baja precisión de recuperación de los modelos monolingües al realizar trabajos de recuperación de lenguaje en otros lenguajes de programación. Y en algunos casos, la precisión de recuperación de MPLCS puede incluso superar la precisión de recuperación de los modelos monolingües cuando realizan trabajos de recuperación de lenguaje en sí mismos.
Descripción
La recuperación semántica de código es la tarea de recuperar códigos relevantes basados en consultas en lenguaje natural. Aunque está relacionada con otras tareas de recuperación de información, necesita cerrar las brechas entre el lenguaje utilizado en el código (que suele ser específico de sintaxis y lógica) y el lenguaje natural, que es más adecuado para describir conceptos e ideas ambiguas. Los enfoques existentes estudian la recuperación de código en un lenguaje natural para un lenguaje de programación específico, sin embargo, es engorroso y a menudo requiere una gran cantidad de corpus para cada idioma al tratar con escenarios multilingües. Mediante la destilación de conocimiento de seis Modelos Docentes monolingües existentes para entrenar un Modelo Estudiantil-MPLCS (Búsqueda de Código de Lenguaje de Programación Múltiple), este documento propuso un método para respaldar tareas de búsqueda de código de múltiples lenguajes de programación. MPLCS tiene la capacidad de incorporar varios idiomas en un solo modelo con bajos requisitos de corpus. MPLCS puede estudiar la similitud entre diferentes lenguajes de programación y mejorar la precisión de recuperación para lenguajes de código de conjuntos de datos pequeños. En cuanto a Ruby utilizado en este documento, MPLCS mejoró su puntuación MRR en un 20 a 25%. Además, MPLCS puede compensar la baja precisión de recuperación de los modelos monolingües al realizar trabajos de recuperación de lenguaje en otros lenguajes de programación. Y en algunos casos, la precisión de recuperación de MPLCS puede incluso superar la precisión de recuperación de los modelos monolingües cuando realizan trabajos de recuperación de lenguaje en sí mismos.