Sistema de clasificación de malware de conjunto utilizando redes neuronales profundas
Autores: Narayanan, Barath Narayanan; Davuluru, Venkata Salini Priyamvada
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Sistema de clasificación de malware de conjunto utilizando redes neuronales profundas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Avance
Tecnología
Programas de malware
Sistema de clasificación
Redes neuronales
Conjunto de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
Con el avance de la tecnología, existe una creciente necesidad de clasificar programas de malware que podrían potencialmente dañar cualquier sistema informático y/o dispositivos más pequeños. En esta investigación, se propone un sistema de clasificación de conjunto que comprende redes neuronales convolucionales y recurrentes para distinguir programas de malware. Se utiliza el conjunto de datos del Desafío de Clasificación de Malware de Microsoft (BIG 2015) con nueve clases distintas para este estudio. Este conjunto de datos contiene un archivo de ensamblaje y un archivo compilado para cada programa de malware. Los archivos compilados se visualizan como imágenes y se clasifican utilizando Redes Neuronales Convolucionales (CNN). Los archivos de ensamblaje consisten en códigos de operación de lenguaje de máquina que se distinguen entre clases utilizando redes Long Short-Term Memory (LSTM) después de convertirlos en secuencias. Además, se extraen características de estas arquitecturas (CNN y LSTM) y se clasifican utilizando una máquina de vectores de soporte o regresión logística. Se logra una precisión del 97.2% utilizando la red LSTM para distinguir archivos de ensamblaje, 99.4% utilizando la arquitectura CNN para clasificar archivos compilados y una precisión general del 99.8% utilizando el enfoque de conjunto propuesto, estableciendo así un nuevo punto de referencia. Un sistema de clasificación independiente y automatizado para archivos de ensamblaje y/o compilados proporciona a los expertos de la industria antivirus la posibilidad de elegir el tipo de sistema según sus recursos computacionales disponibles.
Descripción
Con el avance de la tecnología, existe una creciente necesidad de clasificar programas de malware que podrían potencialmente dañar cualquier sistema informático y/o dispositivos más pequeños. En esta investigación, se propone un sistema de clasificación de conjunto que comprende redes neuronales convolucionales y recurrentes para distinguir programas de malware. Se utiliza el conjunto de datos del Desafío de Clasificación de Malware de Microsoft (BIG 2015) con nueve clases distintas para este estudio. Este conjunto de datos contiene un archivo de ensamblaje y un archivo compilado para cada programa de malware. Los archivos compilados se visualizan como imágenes y se clasifican utilizando Redes Neuronales Convolucionales (CNN). Los archivos de ensamblaje consisten en códigos de operación de lenguaje de máquina que se distinguen entre clases utilizando redes Long Short-Term Memory (LSTM) después de convertirlos en secuencias. Además, se extraen características de estas arquitecturas (CNN y LSTM) y se clasifican utilizando una máquina de vectores de soporte o regresión logística. Se logra una precisión del 97.2% utilizando la red LSTM para distinguir archivos de ensamblaje, 99.4% utilizando la arquitectura CNN para clasificar archivos compilados y una precisión general del 99.8% utilizando el enfoque de conjunto propuesto, estableciendo así un nuevo punto de referencia. Un sistema de clasificación independiente y automatizado para archivos de ensamblaje y/o compilados proporciona a los expertos de la industria antivirus la posibilidad de elegir el tipo de sistema según sus recursos computacionales disponibles.