Kdtm: modelo de transferencia de destilación de conocimiento de múltiples etapas para la detección de DGA de larga cola
Autores: Fan, Baoyu; Ma, Han; Liu, Yue; Yuan, Xiaochen; Ke, Wei
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Kdtm: modelo de transferencia de destilación de conocimiento de múltiples etapas para la detección de DGA de larga cola
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estrategia de ataque
Botnets
Algoritmo de Generación de Dominios
Modelos de aprendizaje profundo
Nombres de dominio DGA
Aprendizaje por transferencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Como la estrategia de ataque más comúnmente utilizada por Botnets, el Algoritmo de Generación de Dominios (DGA) tiene una fuerte invisibilidad y variabilidad. El uso de modelos de aprendizaje profundo para detectar diferentes familias de nombres de dominio DGA puede mejorar la capacidad de defensa de la red contra los hackers. Sin embargo, esta tarea enfrenta un tamaño de muestra extremadamente desequilibrado entre las diferentes categorías de DGA, lo que conduce a una baja precisión de clasificación para las categorías de muestra pequeña e incluso a fallas de clasificación para algunas categorías. Para abordar este problema, introducimos el concepto de larga cola y aumentamos los datos de las categorías de muestra pequeña mediante la transferencia de conocimientos pre-entrenados. En primer lugar, proponemos el Método de Revisión de Datos Equilibrados (DBRM) para reducir la diferencia de tamaño de muestra entre las categorías, generando así un conjunto de datos relativamente equilibrado para el aprendizaje por transferencia. En segundo lugar, proponemos el Modelo de Transferencia de Conocimiento (KTM) para mejorar el conocimiento de las categorías de muestra pequeña. KTM utiliza una transferencia de múltiples etapas para transferir pesos de las categorías de muestra grande a las categorías de muestra pequeña. Además, proponemos el Modelo de Transferencia de Destilación de Conocimiento (KDTM) para aliviar el problema de olvido catastrófico causado por el aprendizaje por transferencia, que agrega una pérdida de destilación de conocimiento basada en el KTM. Los resultados experimentales muestran que KDTM puede mejorar significativamente el rendimiento de clasificación de todas las categorías, especialmente las categorías de muestra pequeña. Puede lograr un puntaje F1 promedio macro de vanguardia del 84.5%. La robustez del modelo KDTM se verifica utilizando tres conjuntos de datos de DGA que siguen las distribuciones de Pareto.
Descripción
Como la estrategia de ataque más comúnmente utilizada por Botnets, el Algoritmo de Generación de Dominios (DGA) tiene una fuerte invisibilidad y variabilidad. El uso de modelos de aprendizaje profundo para detectar diferentes familias de nombres de dominio DGA puede mejorar la capacidad de defensa de la red contra los hackers. Sin embargo, esta tarea enfrenta un tamaño de muestra extremadamente desequilibrado entre las diferentes categorías de DGA, lo que conduce a una baja precisión de clasificación para las categorías de muestra pequeña e incluso a fallas de clasificación para algunas categorías. Para abordar este problema, introducimos el concepto de larga cola y aumentamos los datos de las categorías de muestra pequeña mediante la transferencia de conocimientos pre-entrenados. En primer lugar, proponemos el Método de Revisión de Datos Equilibrados (DBRM) para reducir la diferencia de tamaño de muestra entre las categorías, generando así un conjunto de datos relativamente equilibrado para el aprendizaje por transferencia. En segundo lugar, proponemos el Modelo de Transferencia de Conocimiento (KTM) para mejorar el conocimiento de las categorías de muestra pequeña. KTM utiliza una transferencia de múltiples etapas para transferir pesos de las categorías de muestra grande a las categorías de muestra pequeña. Además, proponemos el Modelo de Transferencia de Destilación de Conocimiento (KDTM) para aliviar el problema de olvido catastrófico causado por el aprendizaje por transferencia, que agrega una pérdida de destilación de conocimiento basada en el KTM. Los resultados experimentales muestran que KDTM puede mejorar significativamente el rendimiento de clasificación de todas las categorías, especialmente las categorías de muestra pequeña. Puede lograr un puntaje F1 promedio macro de vanguardia del 84.5%. La robustez del modelo KDTM se verifica utilizando tres conjuntos de datos de DGA que siguen las distribuciones de Pareto.