AndroDFA: Clasificación de Malware en Android Basada en el Consumo de Recursos
Autores: Massarelli, Luca; Aniello, Leonardo; Ciccotelli, Claudio; Querzoni, Leonardo; Ucci, Daniele; Baldoni, Roberto
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
AndroDFA: Clasificación de Malware en Android Basada en el Consumo de Recursos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Android
Malware
Clasificación
Análisis
Características
Evaluación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La gran mayoría del malware móvil actual está dirigido a dispositivos Android. Una tarea importante del análisis de malware es la clasificación de muestras maliciosas en familias conocidas. En este artículo, proponemos AndroDFA (DFA, análisis de fluctuación detrendida): un enfoque para la clasificación de familias de malware en Android basado en el análisis dinámico de métricas de consumo de recursos disponibles en el sistema de archivos proc. Estas métricas se pueden medir fácilmente durante la ejecución de la muestra. De cada malware, extraemos características a través del análisis de fluctuación detrendida (DFA) y la correlación de Pearson, luego se emplea una máquina de soporte vectorial para clasificar el malware en familias. Proporcionamos una evaluación experimental basada en muestras de malware de dos conjuntos de datos, a saber, Drebin y AMD. Con el conjunto de datos de Drebin, obtuvimos una precisión de clasificación del 82%, comparable con trabajos del estado del arte como DroidScribe. Sin embargo, en comparación con DroidScribe, nuestro enfoque es más fácil de reproducir porque se basa únicamente en herramientas disponibles públicamente, no requiere ninguna modificación en el entorno emulado o en el sistema operativo Android, y por diseño, también se puede utilizar en dispositivos físicos en lugar de exclusivamente en emuladores. Esto último es un factor clave porque el malware móvil moderno puede detectar el entorno emulado y ocultar su comportamiento malicioso. Los experimentos en el conjunto de datos de AMD dieron resultados similares, con una precisión media general del 78%. Además, hicimos que el software que desarrollamos estuviera disponible públicamente, para facilitar la reproducibilidad de nuestros resultados.
Descripción
La gran mayoría del malware móvil actual está dirigido a dispositivos Android. Una tarea importante del análisis de malware es la clasificación de muestras maliciosas en familias conocidas. En este artículo, proponemos AndroDFA (DFA, análisis de fluctuación detrendida): un enfoque para la clasificación de familias de malware en Android basado en el análisis dinámico de métricas de consumo de recursos disponibles en el sistema de archivos proc. Estas métricas se pueden medir fácilmente durante la ejecución de la muestra. De cada malware, extraemos características a través del análisis de fluctuación detrendida (DFA) y la correlación de Pearson, luego se emplea una máquina de soporte vectorial para clasificar el malware en familias. Proporcionamos una evaluación experimental basada en muestras de malware de dos conjuntos de datos, a saber, Drebin y AMD. Con el conjunto de datos de Drebin, obtuvimos una precisión de clasificación del 82%, comparable con trabajos del estado del arte como DroidScribe. Sin embargo, en comparación con DroidScribe, nuestro enfoque es más fácil de reproducir porque se basa únicamente en herramientas disponibles públicamente, no requiere ninguna modificación en el entorno emulado o en el sistema operativo Android, y por diseño, también se puede utilizar en dispositivos físicos en lugar de exclusivamente en emuladores. Esto último es un factor clave porque el malware móvil moderno puede detectar el entorno emulado y ocultar su comportamiento malicioso. Los experimentos en el conjunto de datos de AMD dieron resultados similares, con una precisión media general del 78%. Además, hicimos que el software que desarrollamos estuviera disponible públicamente, para facilitar la reproducibilidad de nuestros resultados.