Detección automatizada de malware en tiendas de aplicaciones móviles basada en una generación de características robusta
Autores: Alazab, Moutaz
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Detección automatizada de malware en tiendas de aplicaciones móviles basada en una generación de características robusta
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Internet de las cosas
Dispositivos móviles
Detección de malware
Ciberataques
Algoritmos de aprendizaje automático
Llamadas de API
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Muchos servicios de Internet de las Cosas (IoT) son actualmente rastreados y regulados a través de dispositivos móviles, lo que los hace vulnerables a ataques de privacidad y explotación por diversas aplicaciones maliciosas. Las soluciones actuales no pueden mantenerse al ritmo del rápido crecimiento del malware y están limitadas por la baja precisión de detección, el largo tiempo de descubrimiento, la implementación compleja y los altos costos computacionales asociados con la velocidad del procesador, la energía y la memoria. Por lo tanto, es necesaria una técnica de inteligencia automatizada para detectar aplicaciones que contienen malware y predecir de manera efectiva ciberataques en los mercados móviles. En este estudio, se propone un sistema para clasificar aplicaciones de mercados móviles utilizando conjuntos de datos del mundo real, que analiza el código fuente para identificar aplicaciones maliciosas. Se propone un conjunto de características completo de llamadas a interfaces de programación de aplicaciones (API) para capturar las regularidades en aplicaciones que contienen contenido malicioso. Se examinaron dos métodos de selección de características, Chi-Cuadrado y ANOVA, en conjunto con diez algoritmos de aprendizaje automático supervisado. La precisión de detección de cada clasificador se evaluó para identificar el clasificador más confiable para la detección de malware utilizando varios conjuntos de características. Se encontró que Chi-Cuadrado tenía una mayor precisión de detección en comparación con ANOVA. El sistema propuesto logró una precisión de detección del 98.1% con un tiempo de clasificación de 1.22 s. Además, el sistema propuesto requirió un número reducido de llamadas a API (500 en lugar de 9000) para ser incorporadas como características.
Descripción
Muchos servicios de Internet de las Cosas (IoT) son actualmente rastreados y regulados a través de dispositivos móviles, lo que los hace vulnerables a ataques de privacidad y explotación por diversas aplicaciones maliciosas. Las soluciones actuales no pueden mantenerse al ritmo del rápido crecimiento del malware y están limitadas por la baja precisión de detección, el largo tiempo de descubrimiento, la implementación compleja y los altos costos computacionales asociados con la velocidad del procesador, la energía y la memoria. Por lo tanto, es necesaria una técnica de inteligencia automatizada para detectar aplicaciones que contienen malware y predecir de manera efectiva ciberataques en los mercados móviles. En este estudio, se propone un sistema para clasificar aplicaciones de mercados móviles utilizando conjuntos de datos del mundo real, que analiza el código fuente para identificar aplicaciones maliciosas. Se propone un conjunto de características completo de llamadas a interfaces de programación de aplicaciones (API) para capturar las regularidades en aplicaciones que contienen contenido malicioso. Se examinaron dos métodos de selección de características, Chi-Cuadrado y ANOVA, en conjunto con diez algoritmos de aprendizaje automático supervisado. La precisión de detección de cada clasificador se evaluó para identificar el clasificador más confiable para la detección de malware utilizando varios conjuntos de características. Se encontró que Chi-Cuadrado tenía una mayor precisión de detección en comparación con ANOVA. El sistema propuesto logró una precisión de detección del 98.1% con un tiempo de clasificación de 1.22 s. Además, el sistema propuesto requirió un número reducido de llamadas a API (500 en lugar de 9000) para ser incorporadas como características.