Un enfoque híbrido de atención para la detección de malware basado en la alineación y fusión de múltiples características
Autores: Yang, Xing; Yang, Denghui; Li, Yizhou
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un enfoque híbrido de atención para la detección de malware basado en la alineación y fusión de múltiples características
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Malware
Detección
Características
Fusión
Extracción
Modelos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Con el uso generalizado de computadoras, la cantidad de malware ha aumentado exponencialmente. Dado que la detección dinámica es costosa en términos de tiempo y recursos, la mayoría de los métodos de detección de malware existentes se basan en características estáticas. Sin embargo, los métodos estáticos existentes principalmente se basan en tipos de características únicas de malware, mientras que pocos prestan atención a la fusión de múltiples características. Este documento presenta un novedoso método de extracción y fusión de múltiples características para detectar eficazmente variantes de malware mediante la combinación de características binarias y de opcode. Proponemos una red convolucional apilada para capturar la información temporal y de discontinuidad en la llamada a la función del archivo binario de malware. Además, adoptamos el algoritmo de atención triangular para extraer características a nivel de código del código de ensamblador. Además, estas dos características extraídas se alinean y fusionan mediante la atención cruzada, lo que podría proporcionar una representación estable de características. Evaluamos nuestro método en dos conjuntos de datos diferentes. Logra una precisión del 0.9954 en el conjunto de datos de clasificación de malware de Kaggle y una precisión del 0.9544 en un gran conjunto de datos del mundo real. Para optimizar nuestro modelo de detección, realizamos discusiones en profundidad sobre diferentes extractores de características y estrategias de fusión de múltiples características. Además, se proporciona un módulo de atención visualizado en nuestro modelo para explicar su superioridad en la extracción de características de opcode. Se realiza un análisis experimental contra cinco modelos de aprendizaje profundo de referencia y cinco modelos de detección de malware de vanguardia, que revela que nuestra estrategia supera a los enfoques competidores en todas las circunstancias de evaluación.
Descripción
Con el uso generalizado de computadoras, la cantidad de malware ha aumentado exponencialmente. Dado que la detección dinámica es costosa en términos de tiempo y recursos, la mayoría de los métodos de detección de malware existentes se basan en características estáticas. Sin embargo, los métodos estáticos existentes principalmente se basan en tipos de características únicas de malware, mientras que pocos prestan atención a la fusión de múltiples características. Este documento presenta un novedoso método de extracción y fusión de múltiples características para detectar eficazmente variantes de malware mediante la combinación de características binarias y de opcode. Proponemos una red convolucional apilada para capturar la información temporal y de discontinuidad en la llamada a la función del archivo binario de malware. Además, adoptamos el algoritmo de atención triangular para extraer características a nivel de código del código de ensamblador. Además, estas dos características extraídas se alinean y fusionan mediante la atención cruzada, lo que podría proporcionar una representación estable de características. Evaluamos nuestro método en dos conjuntos de datos diferentes. Logra una precisión del 0.9954 en el conjunto de datos de clasificación de malware de Kaggle y una precisión del 0.9544 en un gran conjunto de datos del mundo real. Para optimizar nuestro modelo de detección, realizamos discusiones en profundidad sobre diferentes extractores de características y estrategias de fusión de múltiples características. Además, se proporciona un módulo de atención visualizado en nuestro modelo para explicar su superioridad en la extracción de características de opcode. Se realiza un análisis experimental contra cinco modelos de aprendizaje profundo de referencia y cinco modelos de detección de malware de vanguardia, que revela que nuestra estrategia supera a los enfoques competidores en todas las circunstancias de evaluación.