Detección de malware en android utilizando aprendizaje automático con selección de características basada en el algoritmo genético
Autores: Lee, Jaehyeong; Jang, Hyuk; Ha, Sungmin; Yoon, Yourim
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de malware en android utilizando aprendizaje automático con selección de características basada en el algoritmo genético
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje automático
Malware de Android
Algoritmos genéticos
Selección de características
Rendimiento
Detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Desde el descubrimiento de que el aprendizaje automático se puede utilizar para detectar eficazmente malware en Android, se han realizado muchos estudios sobre técnicas de detección de malware basadas en aprendizaje automático. Se han propuesto varios métodos basados en la selección de características, particularmente algoritmos genéticos, para aumentar el rendimiento y reducir costos. Sin embargo, debido a que aún no se han comparado con otros métodos y sus muchas características no han sido suficientemente verificadas, dichos métodos tienen ciertas limitaciones. Este estudio investiga si la selección de características basada en algoritmos genéticos ayuda en la detección de malware en Android. Aplicamos nueve algoritmos de aprendizaje automático con selección de características basada en algoritmos genéticos para 1104 características estáticas a través de 5000 aplicaciones benignas y 2500 malwares incluidos en el conjunto de datos Andro-AutoPsy. Los resultados experimentales comparativos muestran que el algoritmo genético tuvo un mejor rendimiento que el método basado en ganancia de información, que generalmente se utiliza como método de selección de características. Además, el aprendizaje automático utilizando la selección de características propuesta basada en algoritmos genéticos tiene una ventaja absoluta en términos de tiempo en comparación con el aprendizaje automático sin selección de características. Los resultados indican que la incorporación de algoritmos genéticos en la detección de malware en Android es un enfoque valioso. Además, para mejorar el rendimiento en la detección de malware, es útil aplicar la selección de características basada en algoritmos genéticos al aprendizaje automático.
Descripción
Desde el descubrimiento de que el aprendizaje automático se puede utilizar para detectar eficazmente malware en Android, se han realizado muchos estudios sobre técnicas de detección de malware basadas en aprendizaje automático. Se han propuesto varios métodos basados en la selección de características, particularmente algoritmos genéticos, para aumentar el rendimiento y reducir costos. Sin embargo, debido a que aún no se han comparado con otros métodos y sus muchas características no han sido suficientemente verificadas, dichos métodos tienen ciertas limitaciones. Este estudio investiga si la selección de características basada en algoritmos genéticos ayuda en la detección de malware en Android. Aplicamos nueve algoritmos de aprendizaje automático con selección de características basada en algoritmos genéticos para 1104 características estáticas a través de 5000 aplicaciones benignas y 2500 malwares incluidos en el conjunto de datos Andro-AutoPsy. Los resultados experimentales comparativos muestran que el algoritmo genético tuvo un mejor rendimiento que el método basado en ganancia de información, que generalmente se utiliza como método de selección de características. Además, el aprendizaje automático utilizando la selección de características propuesta basada en algoritmos genéticos tiene una ventaja absoluta en términos de tiempo en comparación con el aprendizaje automático sin selección de características. Los resultados indican que la incorporación de algoritmos genéticos en la detección de malware en Android es un enfoque valioso. Además, para mejorar el rendimiento en la detección de malware, es útil aplicar la selección de características basada en algoritmos genéticos al aprendizaje automático.