Una mirada más cercana a la efectividad del aprendizaje automático en la detección de malware en Android
Autores: Giannakas, Filippos; Kouliaridis, Vasileios; Kambourakis, Georgios
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Una mirada más cercana a la efectividad del aprendizaje automático en la detección de malware en Android
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Dispositivos android
Detección de malware
Algoritmos de aprendizaje automático
Optimización
Evaluación
Métricas de rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Hoy en día, con el uso creciente de dispositivos Android en las actividades diarias, el malware ha estado aumentando rápidamente, poniendo en riesgo la seguridad y la privacidad de las personas. Para mitigar esta amenaza, varios investigadores han propuesto diferentes métodos para detectar malware en Android. Recientemente, se han explorado modelos basados en aprendizaje automático por una masa significativa de investigadores que buscan malware en Android. Sin embargo, seleccionar el modelo más apropiado no es sencillo, ya que hay varios aspectos que deben considerarse. Contribuyendo a este dominio, el presente documento explora la detección de malware en Android desde diversas perspectivas; esto se logra optimizando y evaluando varios algoritmos de aprendizaje automático. Específicamente, realizamos un experimento para entrenar, optimizar y evaluar 27 algoritmos de aprendizaje automático y una Red Neuronal Profunda (DNN). Durante la fase de optimización, realizamos un análisis de hiperparámetros utilizando el marco Optuna. La fase de evaluación incluye la medición de diferentes métricas de rendimiento contra un conjunto de datos contemporáneo y rico, para concluir con el modelo más preciso. El mejor modelo fue interpretado además mediante un análisis de características, utilizando el marco de Explicaciones Aditivas de Shapley (SHAP). Los resultados de nuestro experimento mostraron que el mejor modelo es la DNN que consta de cuatro capas (dos ocultas), utilizando el optimizador Adamax, así como la Entropía Cruzada Binaria (pérdida) y las funciones de activación Softsign. El modelo logró una precisión de predicción del 86%, mientras que la precisión equilibrada, el F1-score y las métricas ROC-AUC se situaron en el 82%.
Descripción
Hoy en día, con el uso creciente de dispositivos Android en las actividades diarias, el malware ha estado aumentando rápidamente, poniendo en riesgo la seguridad y la privacidad de las personas. Para mitigar esta amenaza, varios investigadores han propuesto diferentes métodos para detectar malware en Android. Recientemente, se han explorado modelos basados en aprendizaje automático por una masa significativa de investigadores que buscan malware en Android. Sin embargo, seleccionar el modelo más apropiado no es sencillo, ya que hay varios aspectos que deben considerarse. Contribuyendo a este dominio, el presente documento explora la detección de malware en Android desde diversas perspectivas; esto se logra optimizando y evaluando varios algoritmos de aprendizaje automático. Específicamente, realizamos un experimento para entrenar, optimizar y evaluar 27 algoritmos de aprendizaje automático y una Red Neuronal Profunda (DNN). Durante la fase de optimización, realizamos un análisis de hiperparámetros utilizando el marco Optuna. La fase de evaluación incluye la medición de diferentes métricas de rendimiento contra un conjunto de datos contemporáneo y rico, para concluir con el modelo más preciso. El mejor modelo fue interpretado además mediante un análisis de características, utilizando el marco de Explicaciones Aditivas de Shapley (SHAP). Los resultados de nuestro experimento mostraron que el mejor modelo es la DNN que consta de cuatro capas (dos ocultas), utilizando el optimizador Adamax, así como la Entropía Cruzada Binaria (pérdida) y las funciones de activación Softsign. El modelo logró una precisión de predicción del 86%, mientras que la precisión equilibrada, el F1-score y las métricas ROC-AUC se situaron en el 82%.