ModDiff: Detección de Homologación de Malware Basada en Similitud de Modularidad
Autores: Sun, Huaqi; Shu, Hui; Kang, Fei; Guang, Yan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
ModDiff: Detección de Homologación de Malware Basada en Similitud de Modularidad
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Códigos maliciosos
Ciberseguridad
Análisis de malware
Detección de similitud de códigos binarios
ModDiff
Técnicas de aprendizaje profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 51
Citaciones: Sin citaciones
En los últimos años, el número y la escala de códigos maliciosos han crecido exponencialmente, representando una amenaza creciente para la ciberseguridad. Por lo tanto, tiene un gran valor de investigación identificar rápidamente variantes de malware y dominar su información familiar. La detección de similitud de códigos binarios, como técnica clave en el análisis inverso, juega un papel indispensable en el análisis de malware. Sin embargo, la mayoría de los métodos existentes se centran en la similitud a nivel de función o bloque básico, ignorando la composición modular de malware. Implementar la detección de similitud entre módulos de malware mejoraría considerablemente la eficiencia y precisión de la detección de homología. Inspirado por la exitosa aplicación de técnicas de aprendizaje profundo en el análisis de programas, proponemos un método de detección de similitud de módulos de código binario llamado ModDiff. Abstrae el malware en gráficos de atributos, agrupa funciones utilizando algoritmos de agrupamiento embebidos en gráficos para descomponer el malware en módulos basados en funciones, y calcula la similitud de módulos utilizando algoritmos de coincidencia de gráficos y algoritmos de detección de similitud de funciones basados en procesamiento de lenguaje natural. Los resultados experimentales indicaron que ModDiff mejora la precisión de la partición de módulos en un 10,8% en comparación con trabajos anteriores, y se logra el mayor puntaje F1 del 89% en la detección de homologación de malware. Estos resultados demuestran la efectividad de ModDiff en la detección y análisis de malware con un importante valor de aplicación y perspectivas de desarrollo.
Descripción
En los últimos años, el número y la escala de códigos maliciosos han crecido exponencialmente, representando una amenaza creciente para la ciberseguridad. Por lo tanto, tiene un gran valor de investigación identificar rápidamente variantes de malware y dominar su información familiar. La detección de similitud de códigos binarios, como técnica clave en el análisis inverso, juega un papel indispensable en el análisis de malware. Sin embargo, la mayoría de los métodos existentes se centran en la similitud a nivel de función o bloque básico, ignorando la composición modular de malware. Implementar la detección de similitud entre módulos de malware mejoraría considerablemente la eficiencia y precisión de la detección de homología. Inspirado por la exitosa aplicación de técnicas de aprendizaje profundo en el análisis de programas, proponemos un método de detección de similitud de módulos de código binario llamado ModDiff. Abstrae el malware en gráficos de atributos, agrupa funciones utilizando algoritmos de agrupamiento embebidos en gráficos para descomponer el malware en módulos basados en funciones, y calcula la similitud de módulos utilizando algoritmos de coincidencia de gráficos y algoritmos de detección de similitud de funciones basados en procesamiento de lenguaje natural. Los resultados experimentales indicaron que ModDiff mejora la precisión de la partición de módulos en un 10,8% en comparación con trabajos anteriores, y se logra el mayor puntaje F1 del 89% en la detección de homologación de malware. Estos resultados demuestran la efectividad de ModDiff en la detección y análisis de malware con un importante valor de aplicación y perspectivas de desarrollo.