Un marco simplificado de clasificación de malware metamórfico a través de muestreo y procesamiento paralelo
Autores: Lyu, Jian; Xue, Jingfeng; Han, Weijie; Zhang, Qian; Zhu, Yufen
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un marco simplificado de clasificación de malware metamórfico a través de muestreo y procesamiento paralelo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Malware
Variantes
Técnicas metamórficas
Clasificación
MalSEF
Secuencias de Opcode
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Hoy en día, el malware sigue siendo una amenaza significativa para el ciberespacio actual. Más seriamente, los autores de malware frecuentemente utilizan técnicas metamórficas para crear numerosas variantes, lo que representa una carga pesada para los investigadores de malware. Ser capaz de clasificar estas muestras de malware metamórfico en sus respectivas familias podría acelerar eficientemente la tarea de análisis de malware. Basándonos en nuestro análisis exhaustivo, estas variantes suelen implementarse mediante cambios en sus secuencias de instrucciones de ensamblaje hasta cierto punto. Motivados por este hallazgo, presentamos un marco de clasificación de familias de malware llamado MalSEF, que aprovecha el muestreo y el procesamiento paralelo para clasificar de manera eficiente y efectiva la gran cantidad de variantes de malware metamórfico. Al principio, atenúa la complejidad de la ingeniería de características extrayendo una pequeña parte de muestras representativas del conjunto de datos completo y estableciendo un vector de características simple basado en las secuencias de Opcode; luego, genera la matriz de características y lleva a cabo la tarea de clasificación en paralelo con la colaboración utilizando múltiples núcleos y un esquema de recomendación proactivo. Por último, su practicidad se fortalece para hacer frente al gran volumen de variantes de malware diversificadas basadas en plataformas informáticas comunes. Nuestros experimentos exhaustivos realizados en el conjunto de datos de malware de Kaggle demuestran que MalSEF logra una precisión de clasificación de hasta el 98.53% y reduce la sobrecarga de tiempo en un 37.60% en comparación con el procedimiento de procesamiento en serie.
Descripción
Hoy en día, el malware sigue siendo una amenaza significativa para el ciberespacio actual. Más seriamente, los autores de malware frecuentemente utilizan técnicas metamórficas para crear numerosas variantes, lo que representa una carga pesada para los investigadores de malware. Ser capaz de clasificar estas muestras de malware metamórfico en sus respectivas familias podría acelerar eficientemente la tarea de análisis de malware. Basándonos en nuestro análisis exhaustivo, estas variantes suelen implementarse mediante cambios en sus secuencias de instrucciones de ensamblaje hasta cierto punto. Motivados por este hallazgo, presentamos un marco de clasificación de familias de malware llamado MalSEF, que aprovecha el muestreo y el procesamiento paralelo para clasificar de manera eficiente y efectiva la gran cantidad de variantes de malware metamórfico. Al principio, atenúa la complejidad de la ingeniería de características extrayendo una pequeña parte de muestras representativas del conjunto de datos completo y estableciendo un vector de características simple basado en las secuencias de Opcode; luego, genera la matriz de características y lleva a cabo la tarea de clasificación en paralelo con la colaboración utilizando múltiples núcleos y un esquema de recomendación proactivo. Por último, su practicidad se fortalece para hacer frente al gran volumen de variantes de malware diversificadas basadas en plataformas informáticas comunes. Nuestros experimentos exhaustivos realizados en el conjunto de datos de malware de Kaggle demuestran que MalSEF logra una precisión de clasificación de hasta el 98.53% y reduce la sobrecarga de tiempo en un 37.60% en comparación con el procedimiento de procesamiento en serie.