Mejora de la clasificación de malware basada en imágenes utilizando redes neuronales convolucionales (CNN) basadas en transformadores
Autores: Ashawa, Moses; Owoh, Nsikak; Hosseinzadeh, Salaheddin; Osamor, Jude
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejora de la clasificación de malware basada en imágenes utilizando redes neuronales convolucionales (CNN) basadas en transformadores
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Muestras de malware
Técnicas avanzadas de evasión
Clasificación de malware basada en imágenes
Algoritmos de aprendizaje automático
Redes neuronales convolucionales
ResNet-152
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
A medida que las muestras de malware crecen en complejidad y emplean técnicas avanzadas de evasión, los métodos de detección tradicionales son insuficientes para clasificar con precisión grandes volúmenes de variantes de malware sofisticado. Para abordar este problema, se han desarrollado técnicas de clasificación de malware basadas en imágenes que aprovechan algoritmos de aprendizaje automático como una solución más óptima a este desafío. Sin embargo, clasificar con precisión las características basadas en la distribución de contenido con intensidades de píxeles únicas a partir de imágenes en escala de grises sigue siendo un desafío. Este documento propone un sistema mejorado de clasificación de malware basado en imágenes utilizando redes neuronales convolucionales (CNN) con ResNet-152 y transformer de visión (ViT). Luego, se comparan las dos arquitecturas para determinar sus capacidades de clasificación. Un total de 6137 archivos benignos y 9861 ejecutables maliciosos se convierten de archivos de texto a enteros sin signo y luego a imágenes. El ViT examinó enteros sin signo como valores de píxeles, mientras que ResNet-152 convirtió los valores de píxeles en puntos flotantes para la clasificación. El resultado de los experimentos demuestra una precisión de alto rendimiento del 99.62% con hiperparámetros efectivos de validación cruzada de 10 pliegues. Los hallazgos indican que el modelo propuesto es capaz de implementarse en entornos de malware dinámicos y complejos, logrando una eficiencia computacional práctica de 47.2 s para la identificación y clasificación de nuevas muestras de malware.
Descripción
A medida que las muestras de malware crecen en complejidad y emplean técnicas avanzadas de evasión, los métodos de detección tradicionales son insuficientes para clasificar con precisión grandes volúmenes de variantes de malware sofisticado. Para abordar este problema, se han desarrollado técnicas de clasificación de malware basadas en imágenes que aprovechan algoritmos de aprendizaje automático como una solución más óptima a este desafío. Sin embargo, clasificar con precisión las características basadas en la distribución de contenido con intensidades de píxeles únicas a partir de imágenes en escala de grises sigue siendo un desafío. Este documento propone un sistema mejorado de clasificación de malware basado en imágenes utilizando redes neuronales convolucionales (CNN) con ResNet-152 y transformer de visión (ViT). Luego, se comparan las dos arquitecturas para determinar sus capacidades de clasificación. Un total de 6137 archivos benignos y 9861 ejecutables maliciosos se convierten de archivos de texto a enteros sin signo y luego a imágenes. El ViT examinó enteros sin signo como valores de píxeles, mientras que ResNet-152 convirtió los valores de píxeles en puntos flotantes para la clasificación. El resultado de los experimentos demuestra una precisión de alto rendimiento del 99.62% con hiperparámetros efectivos de validación cruzada de 10 pliegues. Los hallazgos indican que el modelo propuesto es capaz de implementarse en entornos de malware dinámicos y complejos, logrando una eficiencia computacional práctica de 47.2 s para la identificación y clasificación de nuevas muestras de malware.