Algoritmo knn mejorado para clasificación detallada de flujo de red encriptado
Autores: Ma, Chencheng; Du, Xuehui; Cao, Lifeng
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Algoritmo knn mejorado para clasificación detallada de flujo de red encriptado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Clasificación
Tráfico cifrado
Aprendizaje automático
Vecino más cercano K
Peso de características
Flujos de red
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La clasificación detallada del tráfico cifrado es importante para el análisis de seguridad de la red. Los ataques maliciosos suelen estar cifrados y simulados como tráfico de aplicación o contenido normal. Los métodos de aprendizaje automático supervisado se utilizan ampliamente para la clasificación del tráfico y muestran buenos rendimientos. Sin embargo, necesitan una gran cantidad de datos etiquetados para entrenar un modelo, mientras que los datos etiquetados son difíciles de obtener. Con el objetivo de resolver este problema, este documento propone un método para entrenar un modelo basado en el algoritmo de los k-vecinos más cercanos (KNN), que solo necesita una pequeña cantidad de datos. Debido a que la importancia de diferentes características del tráfico varía, y el KNN tradicional no destaca la importancia de diferentes características, este estudio introduce el concepto de peso de características y propone el algoritmo KNN ponderado por características (WKNN). Además, para obtener el conjunto óptimo de características y el conjunto de pesos de características correspondiente, se propone un algoritmo de autoadaptación de selección de características y pesos de características para WKNN. Además, se establece un marco de clasificación de tres capas para flujos de red cifrados. Basándose en el KNN mejorado y en el marco, este estudio presenta finalmente un método para la clasificación detallada de flujos de red cifrados, que puede identificar el estado de cifrado, el tipo de aplicación y el tipo de contenido de los flujos de red cifrados con precisión del 99.3%, 92.4% y 97.0%, respectivamente.
Descripción
La clasificación detallada del tráfico cifrado es importante para el análisis de seguridad de la red. Los ataques maliciosos suelen estar cifrados y simulados como tráfico de aplicación o contenido normal. Los métodos de aprendizaje automático supervisado se utilizan ampliamente para la clasificación del tráfico y muestran buenos rendimientos. Sin embargo, necesitan una gran cantidad de datos etiquetados para entrenar un modelo, mientras que los datos etiquetados son difíciles de obtener. Con el objetivo de resolver este problema, este documento propone un método para entrenar un modelo basado en el algoritmo de los k-vecinos más cercanos (KNN), que solo necesita una pequeña cantidad de datos. Debido a que la importancia de diferentes características del tráfico varía, y el KNN tradicional no destaca la importancia de diferentes características, este estudio introduce el concepto de peso de características y propone el algoritmo KNN ponderado por características (WKNN). Además, para obtener el conjunto óptimo de características y el conjunto de pesos de características correspondiente, se propone un algoritmo de autoadaptación de selección de características y pesos de características para WKNN. Además, se establece un marco de clasificación de tres capas para flujos de red cifrados. Basándose en el KNN mejorado y en el marco, este estudio presenta finalmente un método para la clasificación detallada de flujos de red cifrados, que puede identificar el estado de cifrado, el tipo de aplicación y el tipo de contenido de los flujos de red cifrados con precisión del 99.3%, 92.4% y 97.0%, respectivamente.