Un método eficiente de clasificación de malware basado en AIFS-IDL y fusión de múltiples características
Autores: Wu, Xuan; Song, Yafei
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un método eficiente de clasificación de malware basado en AIFS-IDL y fusión de múltiples características
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Malware
Métodos de clasificación
Aprendizaje profundo
AIFS-IDL
Características
Precisión de clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En los últimos años, la presencia de malware ha crecido exponencialmente, lo que ha resultado en una enorme demanda de métodos eficientes de clasificación de malware. Sin embargo, los clasificadores basados en aprendizaje automático existentes tienen altas tasas de falsos positivos y no pueden clasificar eficazmente las variantes de malware, los empaquetadores y la ofuscación. Para abordar esta deficiencia, este documento propone un método eficiente basado en aprendizaje profundo llamado AIFS-IDL (Conjuntos Difusos Intuicionistas de Atanassov - Aprendizaje Profundo Integrado), que utiliza características estáticas para clasificar malware. El método propuesto primero extrae seis tipos de características de los archivos de desensamblaje y de bytes y luego las fusiona para resolver el problema de la característica única en los métodos de clasificación tradicionales. A continuación, se utiliza el método basado en conjuntos difusos intuicionistas de Atanassov para integrar el resultado de los tres modelos de aprendizaje profundo, a saber, GRU (Red Neuronal Convolucional Temporal), TCN (Red Neuronal Convolucional Temporal) y CNN (Redes Neuronales Convolucionales), lo que mejora la precisión de clasificación y la generalizabilidad del modelo de clasificación. El método propuesto se verifica mediante experimentos y los resultados muestran que el método propuesto puede mejorar eficazmente la precisión de la clasificación de malware en comparación con los métodos existentes. Se llevaron a cabo experimentos sobre los seis tipos de características del código malicioso y se compararon con algoritmos de clasificación tradicionales y algoritmos de aprendizaje en conjunto. Una variedad de experimentos comparativos muestran que la tasa de precisión de clasificación de la integración de múltiples características y múltiples modelos puede alcanzar el 99.92%. Los resultados muestran que, en comparación con otros métodos de clasificación estática, este método tiene una mejor capacidad de identificación y clasificación de malware.
Descripción
En los últimos años, la presencia de malware ha crecido exponencialmente, lo que ha resultado en una enorme demanda de métodos eficientes de clasificación de malware. Sin embargo, los clasificadores basados en aprendizaje automático existentes tienen altas tasas de falsos positivos y no pueden clasificar eficazmente las variantes de malware, los empaquetadores y la ofuscación. Para abordar esta deficiencia, este documento propone un método eficiente basado en aprendizaje profundo llamado AIFS-IDL (Conjuntos Difusos Intuicionistas de Atanassov - Aprendizaje Profundo Integrado), que utiliza características estáticas para clasificar malware. El método propuesto primero extrae seis tipos de características de los archivos de desensamblaje y de bytes y luego las fusiona para resolver el problema de la característica única en los métodos de clasificación tradicionales. A continuación, se utiliza el método basado en conjuntos difusos intuicionistas de Atanassov para integrar el resultado de los tres modelos de aprendizaje profundo, a saber, GRU (Red Neuronal Convolucional Temporal), TCN (Red Neuronal Convolucional Temporal) y CNN (Redes Neuronales Convolucionales), lo que mejora la precisión de clasificación y la generalizabilidad del modelo de clasificación. El método propuesto se verifica mediante experimentos y los resultados muestran que el método propuesto puede mejorar eficazmente la precisión de la clasificación de malware en comparación con los métodos existentes. Se llevaron a cabo experimentos sobre los seis tipos de características del código malicioso y se compararon con algoritmos de clasificación tradicionales y algoritmos de aprendizaje en conjunto. Una variedad de experimentos comparativos muestran que la tasa de precisión de clasificación de la integración de múltiples características y múltiples modelos puede alcanzar el 99.92%. Los resultados muestran que, en comparación con otros métodos de clasificación estática, este método tiene una mejor capacidad de identificación y clasificación de malware.