Un algoritmo de extracción de características integrativas basado en Simhash para la detección de malware
Autores: Li, Yihong; Liu, Fangzheng; Du, Zhenyu; Zhang, Dubing
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Un algoritmo de extracción de características integrativas basado en Simhash para la detección de malware
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Detección de malware
Códigos maliciosos obfuscados
Algoritmo de extracción de características integrativo
Información estática
Información dinámica
Algoritmos de aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 46
Citaciones: Sin citaciones
En el proceso de detección de malware, los códigos maliciosos ofuscados no pueden ser detectados de manera eficiente y precisa únicamente en el espacio de características dinámicas o estáticas. Con el objetivo de abordar este problema, se propuso un algoritmo de extracción de características integrativas basado en simhash, que combina la información estática, por ejemplo, las llamadas a API (Interfaz de Programación de Aplicaciones), y la información dinámica (como comportamientos de archivos, registro y red) de muestras maliciosas para formar características integrativas. El experimento extrae las características integrativas de cierta información estática e información dinámica, y luego compara la clasificación, el tiempo y el rendimiento de detección de ofuscación de las características estáticas, dinámicas e integradas, respectivamente, utilizando varios algoritmos comunes de aprendizaje automático. Los resultados muestran que las características integrativas tienen un mejor rendimiento en tiempo que las características estáticas, y un mejor rendimiento de clasificación que las características dinámicas, y casi el mismo rendimiento de detección de ofuscación que las características dinámicas. Este algoritmo puede proporcionar algún soporte para la extracción de características en la detección de malware.
Descripción
En el proceso de detección de malware, los códigos maliciosos ofuscados no pueden ser detectados de manera eficiente y precisa únicamente en el espacio de características dinámicas o estáticas. Con el objetivo de abordar este problema, se propuso un algoritmo de extracción de características integrativas basado en simhash, que combina la información estática, por ejemplo, las llamadas a API (Interfaz de Programación de Aplicaciones), y la información dinámica (como comportamientos de archivos, registro y red) de muestras maliciosas para formar características integrativas. El experimento extrae las características integrativas de cierta información estática e información dinámica, y luego compara la clasificación, el tiempo y el rendimiento de detección de ofuscación de las características estáticas, dinámicas e integradas, respectivamente, utilizando varios algoritmos comunes de aprendizaje automático. Los resultados muestran que las características integrativas tienen un mejor rendimiento en tiempo que las características estáticas, y un mejor rendimiento de clasificación que las características dinámicas, y casi el mismo rendimiento de detección de ofuscación que las características dinámicas. Este algoritmo puede proporcionar algún soporte para la extracción de características en la detección de malware.