Algoritmo de visualización de características locales basado en FastText para el marco de clasificación de malware basado en imágenes fusionadas para ciberseguridad y defensa cibernética
Autores: Jang, Sejun; Li, Shuyu; Sung, Yunsick
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Algoritmo de visualización de características locales basado en FastText para el marco de clasificación de malware basado en imágenes fusionadas para ciberseguridad y defensa cibernética
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Importformación
Ciberseguridad
Malware
Detección
Clasificación
Visualización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La importancia de la ciberseguridad ha estado aumentando recientemente. Un codificador de malware escribe malware en archivos ejecutables normales. Es más probable que una computadora se infecte con malware cuando los usuarios tienen fácil acceso a varios ejecutables. El malware se considera como el punto de partida de los ciberataques; por lo tanto, la detección oportuna, clasificación y bloqueo del malware son importantes. La visualización de malware es un método para detectar o clasificar malware. Se visualiza una imagen global a través de binarios extraídos del malware. La estructura general y el comportamiento del malware se consideran cuando se utilizan imágenes globales. Sin embargo, la visualización de malware ofuscado es difícil, debido a las dificultades encontradas al extraer características locales. Este estudio propone un marco de clasificación de malware basado en imágenes fusionadas que incluye visualización de características locales, visualización de características locales basadas en imágenes globales y métodos de fusión de imágenes globales y locales. Este estudio introduce un método de visualización de características locales basado en fastText: Primero, se extraen características locales como opcodes y nombres de funciones API del malware; segundo, se seleccionan características locales importantes en cada familia de malware a través del algoritmo de frecuencia de término inversa de documentos; tercero, el modelo fastText incrusta las características locales seleccionadas; finalmente, las características locales incrustadas se visualizan a través de un proceso de normalización. La clasificación de malware basada en el método propuesto utilizando el conjunto de datos del Desafío de Clasificación de Malware de Microsoft fue verificada experimentalmente. La precisión del método propuesto fue aproximadamente del 99.65%, lo que es un 2.18% más alto que el enfoque global basado en imágenes contemporáneo.
Descripción
La importancia de la ciberseguridad ha estado aumentando recientemente. Un codificador de malware escribe malware en archivos ejecutables normales. Es más probable que una computadora se infecte con malware cuando los usuarios tienen fácil acceso a varios ejecutables. El malware se considera como el punto de partida de los ciberataques; por lo tanto, la detección oportuna, clasificación y bloqueo del malware son importantes. La visualización de malware es un método para detectar o clasificar malware. Se visualiza una imagen global a través de binarios extraídos del malware. La estructura general y el comportamiento del malware se consideran cuando se utilizan imágenes globales. Sin embargo, la visualización de malware ofuscado es difícil, debido a las dificultades encontradas al extraer características locales. Este estudio propone un marco de clasificación de malware basado en imágenes fusionadas que incluye visualización de características locales, visualización de características locales basadas en imágenes globales y métodos de fusión de imágenes globales y locales. Este estudio introduce un método de visualización de características locales basado en fastText: Primero, se extraen características locales como opcodes y nombres de funciones API del malware; segundo, se seleccionan características locales importantes en cada familia de malware a través del algoritmo de frecuencia de término inversa de documentos; tercero, el modelo fastText incrusta las características locales seleccionadas; finalmente, las características locales incrustadas se visualizan a través de un proceso de normalización. La clasificación de malware basada en el método propuesto utilizando el conjunto de datos del Desafío de Clasificación de Malware de Microsoft fue verificada experimentalmente. La precisión del método propuesto fue aproximadamente del 99.65%, lo que es un 2.18% más alto que el enfoque global basado en imágenes contemporáneo.