logo móvil
Contáctanos

Una mirada más cercana a la efectividad del aprendizaje automático en la detección de malware en Android

Autores: Giannakas, Filippos; Kouliaridis, Vasileios; Kambourakis, Georgios

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Una mirada más cercana a la efectividad del aprendizaje automático en la detección de malware en Android


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Dispositivos android
Detección de malware
Algoritmos de aprendizaje automático
Optimización
Evaluación
Métricas de rendimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Hoy en día, con el uso creciente de dispositivos Android en las actividades diarias, el malware ha estado aumentando rápidamente, poniendo en riesgo la seguridad y la privacidad de las personas. Para mitigar esta amenaza, varios investigadores han propuesto diferentes métodos para detectar malware en Android. Recientemente, se han explorado modelos basados en aprendizaje automático por una masa significativa de investigadores que buscan malware en Android. Sin embargo, seleccionar el modelo más apropiado no es sencillo, ya que hay varios aspectos que deben considerarse. Contribuyendo a este dominio, el presente documento explora la detección de malware en Android desde diversas perspectivas; esto se logra optimizando y evaluando varios algoritmos de aprendizaje automático. Específicamente, realizamos un experimento para entrenar, optimizar y evaluar 27 algoritmos de aprendizaje automático y una Red Neuronal Profunda (DNN). Durante la fase de optimización, realizamos un análisis de hiperparámetros utilizando el marco Optuna. La fase de evaluación incluye la medición de diferentes métricas de rendimiento contra un conjunto de datos contemporáneo y rico, para concluir con el modelo más preciso. El mejor modelo fue interpretado además mediante un análisis de características, utilizando el marco de Explicaciones Aditivas de Shapley (SHAP). Los resultados de nuestro experimento mostraron que el mejor modelo es la DNN que consta de cuatro capas (dos ocultas), utilizando el optimizador Adamax, así como la Entropía Cruzada Binaria (pérdida) y las funciones de activación Softsign. El modelo logró una precisión de predicción del 86%, mientras que la precisión equilibrada, el F1-score y las métricas ROC-AUC se situaron en el 82%.

Otros recursos que podrían interesarte

Temas Virtualpro