Evaluación experimental de métodos de clasificación de familias de malware a partir de información secuencial del tráfico cifrado de TLS
Autores: Ha, Joonseo; Roh, Heejun
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Evaluación experimental de métodos de clasificación de familias de malware a partir de información secuencial del tráfico cifrado de TLS
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Malware
Tls
Tráfico encriptado
Detección
Clasificación
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
En paralelo con la rápida adopción de la seguridad en la capa de transporte (TLS), el malware ha utilizado el canal de comunicación cifrado proporcionado por TLS para dificultar la detección desde el tráfico de red. Con este fin, los esfuerzos de investigación recientes se dirigen hacia la detección de malware y la clasificación de familias de malware para el tráfico encriptado por TLS. Sin embargo, entre sus conjuntos de características, las propuestas para utilizar la información secuencial de cada sesión de TLS no han sido evaluadas adecuadamente, especialmente en el contexto de la clasificación de familias de malware. En este contexto, proponemos un marco sistemático para evaluar los métodos de clasificación de familias de malware de vanguardia para el tráfico encriptado por TLS en un entorno controlado y discutir exhaustivamente las ventajas y limitaciones de los métodos. En particular, nuestros resultados experimentales para las 10 combinaciones de representaciones y clasificadores muestran que la representación basada en grafos para la información secuencial logra un mejor rendimiento independientemente de los algoritmos de clasificación evaluados. Con nuestro marco y hallazgos, los investigadores pueden diseñar mejores clasificadores basados en aprendizaje automático.
Descripción
En paralelo con la rápida adopción de la seguridad en la capa de transporte (TLS), el malware ha utilizado el canal de comunicación cifrado proporcionado por TLS para dificultar la detección desde el tráfico de red. Con este fin, los esfuerzos de investigación recientes se dirigen hacia la detección de malware y la clasificación de familias de malware para el tráfico encriptado por TLS. Sin embargo, entre sus conjuntos de características, las propuestas para utilizar la información secuencial de cada sesión de TLS no han sido evaluadas adecuadamente, especialmente en el contexto de la clasificación de familias de malware. En este contexto, proponemos un marco sistemático para evaluar los métodos de clasificación de familias de malware de vanguardia para el tráfico encriptado por TLS en un entorno controlado y discutir exhaustivamente las ventajas y limitaciones de los métodos. En particular, nuestros resultados experimentales para las 10 combinaciones de representaciones y clasificadores muestran que la representación basada en grafos para la información secuencial logra un mejor rendimiento independientemente de los algoritmos de clasificación evaluados. Con nuestro marco y hallazgos, los investigadores pueden diseñar mejores clasificadores basados en aprendizaje automático.