: Modelo semántico de flujo de datos para programas de representación intermedia basado en red de grafos
Autores: Tang, Ke; Shan, Zheng; Zhang, Chunyan; Xu, Lianqiu; Qiao, Meng; Liu, Fudong
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
: Modelo semántico de flujo de datos para programas de representación intermedia basado en red de grafos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Protección de derechos de autor de software
Tecnología de ofuscación de código
Variantes de malware
Detección de códigos maliciosos
Análisis de similitud de códigos binarios
Análisis de programas resistente a la ofuscación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Con la mejora de la conciencia de protección de derechos de autor de software, la tecnología de ofuscación de código juega un papel crucial en la protección de segmentos clave de código. A medida que la tecnología de ofuscación se vuelve cada vez más compleja y diversa, ha generado una gran cantidad de variantes de malware, lo que facilita evadir la detección del software antivirus. La detección de código malicioso depende principalmente del análisis de similitud de código binario. Sin embargo, las tecnologías de análisis de software existentes tienen dificultades para lidiar con las crecientes tecnologías de ofuscación complejas. Para resolver este problema, este documento propone un nuevo método de análisis de programas resistente a la ofuscación, que se basa en la relación de transformación de flujo de datos de la representación intermedia y el modelo de red de grafos. En nuestro enfoque, primero construimos el grafo de transformación de datos basado en LLVM IR. Luego, diseñamos un nuevo modelo de representación de lenguaje intermedio basado en redes de grafos, llamado, para aprender la semántica del flujo de datos a partir de DTG. puede detectar la similitud de código ofuscado extrayendo la información semántica del flujo de datos del programa sin desofuscarlo. Experimentos extensos demuestran que nuestro enfoque es más preciso que las herramientas de desofuscación existentes al buscar funciones similares en código ofuscado.
Descripción
Con la mejora de la conciencia de protección de derechos de autor de software, la tecnología de ofuscación de código juega un papel crucial en la protección de segmentos clave de código. A medida que la tecnología de ofuscación se vuelve cada vez más compleja y diversa, ha generado una gran cantidad de variantes de malware, lo que facilita evadir la detección del software antivirus. La detección de código malicioso depende principalmente del análisis de similitud de código binario. Sin embargo, las tecnologías de análisis de software existentes tienen dificultades para lidiar con las crecientes tecnologías de ofuscación complejas. Para resolver este problema, este documento propone un nuevo método de análisis de programas resistente a la ofuscación, que se basa en la relación de transformación de flujo de datos de la representación intermedia y el modelo de red de grafos. En nuestro enfoque, primero construimos el grafo de transformación de datos basado en LLVM IR. Luego, diseñamos un nuevo modelo de representación de lenguaje intermedio basado en redes de grafos, llamado, para aprender la semántica del flujo de datos a partir de DTG. puede detectar la similitud de código ofuscado extrayendo la información semántica del flujo de datos del programa sin desofuscarlo. Experimentos extensos demuestran que nuestro enfoque es más preciso que las herramientas de desofuscación existentes al buscar funciones similares en código ofuscado.