Detección de malware basada en visualización de código y clasificación de dos niveles
Autores: Moussas, Vassilios; Andreatos, Antonios
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de malware basada en visualización de código y clasificación de dos niveles
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Malware
Variaciones
Visualización
Sistema de detección
Red neuronal artificial
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los creadores de malware generan nuevas muestras de software malicioso realizando cambios menores en el código previamente generado, con el fin de reutilizar código malicioso, así como para pasar desapercibidos por el software antivirus basado en firmas. Como resultado, hoy en día existen varias familias de variaciones del mismo código inicial. La visualización de ejecutables compilados para el análisis de malware se propuso hace varios años. La visualización puede ayudar enormemente en la clasificación de malware y no requiere desensamblaje ni ejecución de código. Además, las nuevas variaciones de familias de malware conocidas son detectadas al instante, en contraste con el software antivirus tradicional basado en firmas. Este documento aborda el problema de identificar variaciones de malware existente visualizadas como imágenes. Se propone un nuevo sistema de detección de malware basado en una Red Neuronal Artificial (ANN) de dos niveles. La clasificación se basa en características de archivos e imágenes. El sistema propuesto se prueba en el conjunto de datos "Malimg", que consiste en la representación visual de familias de malware bien conocidas. A partir de este conjunto se extraen algunas características de imagen importantes. Basado en estas características, se entrena la ANN. Luego, esta ANN se utiliza para detectar y clasificar otras muestras del conjunto de datos. Las familias de malware que crean confusión son clasificadas por un segundo nivel de ANNs. El método de ANN de dos niveles propuesto destaca por su simplicidad, precisión y velocidad; es fácil de implementar y rápido de ejecutar, por lo que puede aplicarse a software antivirus, cortafuegos inteligentes, aplicaciones web, etc.
Descripción
Los creadores de malware generan nuevas muestras de software malicioso realizando cambios menores en el código previamente generado, con el fin de reutilizar código malicioso, así como para pasar desapercibidos por el software antivirus basado en firmas. Como resultado, hoy en día existen varias familias de variaciones del mismo código inicial. La visualización de ejecutables compilados para el análisis de malware se propuso hace varios años. La visualización puede ayudar enormemente en la clasificación de malware y no requiere desensamblaje ni ejecución de código. Además, las nuevas variaciones de familias de malware conocidas son detectadas al instante, en contraste con el software antivirus tradicional basado en firmas. Este documento aborda el problema de identificar variaciones de malware existente visualizadas como imágenes. Se propone un nuevo sistema de detección de malware basado en una Red Neuronal Artificial (ANN) de dos niveles. La clasificación se basa en características de archivos e imágenes. El sistema propuesto se prueba en el conjunto de datos "Malimg", que consiste en la representación visual de familias de malware bien conocidas. A partir de este conjunto se extraen algunas características de imagen importantes. Basado en estas características, se entrena la ANN. Luego, esta ANN se utiliza para detectar y clasificar otras muestras del conjunto de datos. Las familias de malware que crean confusión son clasificadas por un segundo nivel de ANNs. El método de ANN de dos niveles propuesto destaca por su simplicidad, precisión y velocidad; es fácil de implementar y rápido de ejecutar, por lo que puede aplicarse a software antivirus, cortafuegos inteligentes, aplicaciones web, etc.