Uso de Modelos de Lenguaje Grande para la Generación de Código Aeroespacial: Métodos, Referencias y Valores Potenciales
Autores: He, Rui; Zhang, Liang; Lyu, Mengyao; Lyu, Liangqing; Xue, Changbin
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Uso de Modelos de Lenguaje Grande para la Generación de Código Aeroespacial: Métodos, Referencias y Valores Potenciales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Modelos de lenguaje grandes
Tecnología de generación de código
Sector aeroespacial
RepoSpace
Generación aumentada por recuperación
Cadenas de documentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
En los últimos años, los Modelos de Lenguaje Grande (LLMs) han experimentado avances rápidos, revolucionando varios dominios. Dentro del ámbito del desarrollo de software, la tecnología de generación de código impulsada por LLMs ha surgido como un enfoque de investigación destacado. A pesar de su potencial, la aplicación de esta tecnología en el sector aeroespacial sigue en su fase inicial y exploratoria. Este documento profundiza en las complejidades de los métodos de generación de código basados en LLM y explora sus posibles aplicaciones en contextos aeroespaciales. Introduce RepoSpace, la prueba de referencia pionera a nivel de almacén para la generación de código de equipos espaciales. Compuesto por 825 muestras de cinco proyectos reales, este benchmark ofrece una evaluación más precisa de las capacidades de los LLM en escenarios aeroespaciales. A través de evaluaciones extensivas de siete LLM de última generación en RepoSpace, el estudio revela que las diferencias específicas del dominio impactan significativamente en el rendimiento de generación de código de los LLM. Los LLM existentes exhiben un rendimiento inferior en tareas de generación de código a nivel de almacén especializadas para aeroespacial, con su rendimiento notablemente más bajo que el de las tareas del dominio. La investigación demuestra además que la tecnología de Generación Aumentada por Recuperación (RAG) puede mejorar efectivamente las capacidades de generación de código de los LLM. Además, el uso de plantillas de aviso apropiadas puede guiar a los modelos para lograr resultados superiores. Además, se ha encontrado que las cadenas de documentación de alta calidad son cruciales para mejorar el rendimiento de los LLM en tareas de generación de código a nivel de almacén. Este estudio proporciona una referencia vital para aprovechar los LLM en la generación de código en el campo aeroespacial, fomentando así la innovación tecnológica y el progreso en este dominio crítico.
Descripción
En los últimos años, los Modelos de Lenguaje Grande (LLMs) han experimentado avances rápidos, revolucionando varios dominios. Dentro del ámbito del desarrollo de software, la tecnología de generación de código impulsada por LLMs ha surgido como un enfoque de investigación destacado. A pesar de su potencial, la aplicación de esta tecnología en el sector aeroespacial sigue en su fase inicial y exploratoria. Este documento profundiza en las complejidades de los métodos de generación de código basados en LLM y explora sus posibles aplicaciones en contextos aeroespaciales. Introduce RepoSpace, la prueba de referencia pionera a nivel de almacén para la generación de código de equipos espaciales. Compuesto por 825 muestras de cinco proyectos reales, este benchmark ofrece una evaluación más precisa de las capacidades de los LLM en escenarios aeroespaciales. A través de evaluaciones extensivas de siete LLM de última generación en RepoSpace, el estudio revela que las diferencias específicas del dominio impactan significativamente en el rendimiento de generación de código de los LLM. Los LLM existentes exhiben un rendimiento inferior en tareas de generación de código a nivel de almacén especializadas para aeroespacial, con su rendimiento notablemente más bajo que el de las tareas del dominio. La investigación demuestra además que la tecnología de Generación Aumentada por Recuperación (RAG) puede mejorar efectivamente las capacidades de generación de código de los LLM. Además, el uso de plantillas de aviso apropiadas puede guiar a los modelos para lograr resultados superiores. Además, se ha encontrado que las cadenas de documentación de alta calidad son cruciales para mejorar el rendimiento de los LLM en tareas de generación de código a nivel de almacén. Este estudio proporciona una referencia vital para aprovechar los LLM en la generación de código en el campo aeroespacial, fomentando así la innovación tecnológica y el progreso en este dominio crítico.