Lambert: aprovechando mecanismos de atención para mejorar el modelo de ajuste fino de BERT para la clasificación de tráfico encriptado
Autores: Liu, Tao; Ma, Xiting; Liu, Ling; Liu, Xin; Zhao, Yue; Hu, Ning; Ghafoor, Kayhan Zrar
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Lambert: aprovechando mecanismos de atención para mejorar el modelo de ajuste fino de BERT para la clasificación de tráfico encriptado
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tráfico encriptado
Tecnología de IA
Modelo basado en pre-entrenamiento
Modelo de ajuste fino
LAMBERT
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
La clasificación del tráfico cifrado es una parte crucial de la investigación preservadora de la privacidad. Con el gran éxito de la tecnología de inteligencia artificial en campos como el reconocimiento de imágenes y el procesamiento del lenguaje natural, cómo clasificar el tráfico cifrado basado en la tecnología de IA se ha convertido en un tema atractivo en la seguridad de la información. Con una buena capacidad de generalización y alta precisión de entrenamiento, los métodos de clasificación de tráfico cifrado basados en el preentrenamiento se han convertido en la primera opción. La precisión de este tipo de método depende en gran medida del modelo de ajuste fino. Sin embargo, es un desafío para los modelos de ajuste fino existentes integrar de manera efectiva la representación de las características de paquetes y bytes extraídas a través del preentrenamiento. En este artículo se propone un nuevo modelo de ajuste fino, LAMBERT. Al introducir un mecanismo de atención para capturar la relación entre BiGRU y secuencias de bytes, LAMBERT no solo mejora de manera efectiva el fenómeno de pérdida de secuencia de BiGRU, sino que también mejora el rendimiento de procesamiento de la clasificación de flujo cifrado. LAMBERT puede clasificar de manera rápida y precisa múltiples tipos de tráfico cifrado. Los resultados experimentales muestran que nuestro modelo se desempeña bien en conjuntos de datos con distribución desigual de muestras, sin preentrenamiento y clasificación de muestras grandes. LAMBERT fue probado en cuatro conjuntos de datos, a saber, ISCX-VPN-Service, ISCX-VPN-APP, USTC-TFC y CSTNET-TLS 1.3, y los puntajes F1 alcanzaron el 99.15%, 99.52%, 99.30% y 97.41%, respectivamente.
Descripción
La clasificación del tráfico cifrado es una parte crucial de la investigación preservadora de la privacidad. Con el gran éxito de la tecnología de inteligencia artificial en campos como el reconocimiento de imágenes y el procesamiento del lenguaje natural, cómo clasificar el tráfico cifrado basado en la tecnología de IA se ha convertido en un tema atractivo en la seguridad de la información. Con una buena capacidad de generalización y alta precisión de entrenamiento, los métodos de clasificación de tráfico cifrado basados en el preentrenamiento se han convertido en la primera opción. La precisión de este tipo de método depende en gran medida del modelo de ajuste fino. Sin embargo, es un desafío para los modelos de ajuste fino existentes integrar de manera efectiva la representación de las características de paquetes y bytes extraídas a través del preentrenamiento. En este artículo se propone un nuevo modelo de ajuste fino, LAMBERT. Al introducir un mecanismo de atención para capturar la relación entre BiGRU y secuencias de bytes, LAMBERT no solo mejora de manera efectiva el fenómeno de pérdida de secuencia de BiGRU, sino que también mejora el rendimiento de procesamiento de la clasificación de flujo cifrado. LAMBERT puede clasificar de manera rápida y precisa múltiples tipos de tráfico cifrado. Los resultados experimentales muestran que nuestro modelo se desempeña bien en conjuntos de datos con distribución desigual de muestras, sin preentrenamiento y clasificación de muestras grandes. LAMBERT fue probado en cuatro conjuntos de datos, a saber, ISCX-VPN-Service, ISCX-VPN-APP, USTC-TFC y CSTNET-TLS 1.3, y los puntajes F1 alcanzaron el 99.15%, 99.52%, 99.30% y 97.41%, respectivamente.