Vul-Mixer: detección eficiente y efectiva de vulnerabilidades de software asistida por aprendizaje automático
Autores: Grahn, Daniel; Chen, Lingwei; Zhang, Junjie
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Vul-Mixer: detección eficiente y efectiva de vulnerabilidades de software asistida por aprendizaje automático
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje automático
Detección de vulnerabilidades de software
Modelos
Precisión
Generalización
Costos computacionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La investigación reciente de Detección de Vulnerabilidades de Software Asistida por Aprendizaje Automático (MLAVD) se ha centrado en modelos a gran escala con cientos de millones de parámetros impulsados por arquitecturas costosas basadas en atención o gráficos. A pesar de la capacidad de los modelos aumentada, los modelos actuales tienen una precisión limitada y les cuesta generalizar a datos no vistos. Además, los recursos computacionales necesarios para entrenar y servir a los modelos reducen aún más su utilidad. Sostenemos que esto se debe a un desajuste entre cómo los cerebros humanos procesan el código y cómo se diseñan los modelos MLAVD. En este documento, estudiamos enfoques eficientes en recursos para MLAVD con el objetivo de mantener o fortalecer la capacidad de generalización mientras se reducen los costos computacionales de manera que el modelo pueda ejecutarse en una máquina de desarrollo económica. Nuestras contribuciones son las siguientes: (1) Realizamos el primer estudio conocido de MLAVD eficiente en recursos, demostrando que tales modelos pueden ser competitivos con líneas base de MLAVD fuertes; (2) Diseñamos, una arquitectura eficiente en recursos inspirada en cómo el cerebro humano procesa el código; y, (3) Demostramos que Vul-Mixer es eficiente y efectivo al mantener la capacidad de generalización de vanguardia utilizando solo de los parámetros y 173 MB de memoria.
Descripción
La investigación reciente de Detección de Vulnerabilidades de Software Asistida por Aprendizaje Automático (MLAVD) se ha centrado en modelos a gran escala con cientos de millones de parámetros impulsados por arquitecturas costosas basadas en atención o gráficos. A pesar de la capacidad de los modelos aumentada, los modelos actuales tienen una precisión limitada y les cuesta generalizar a datos no vistos. Además, los recursos computacionales necesarios para entrenar y servir a los modelos reducen aún más su utilidad. Sostenemos que esto se debe a un desajuste entre cómo los cerebros humanos procesan el código y cómo se diseñan los modelos MLAVD. En este documento, estudiamos enfoques eficientes en recursos para MLAVD con el objetivo de mantener o fortalecer la capacidad de generalización mientras se reducen los costos computacionales de manera que el modelo pueda ejecutarse en una máquina de desarrollo económica. Nuestras contribuciones son las siguientes: (1) Realizamos el primer estudio conocido de MLAVD eficiente en recursos, demostrando que tales modelos pueden ser competitivos con líneas base de MLAVD fuertes; (2) Diseñamos, una arquitectura eficiente en recursos inspirada en cómo el cerebro humano procesa el código; y, (3) Demostramos que Vul-Mixer es eficiente y efectivo al mantener la capacidad de generalización de vanguardia utilizando solo de los parámetros y 173 MB de memoria.