logo móvil
Contáctanos

Kdtm: modelo de transferencia de destilación de conocimiento de múltiples etapas para la detección de DGA de larga cola

Autores: Fan, Baoyu; Ma, Han; Liu, Yue; Yuan, Xiaochen; Ke, Wei

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Kdtm: modelo de transferencia de destilación de conocimiento de múltiples etapas para la detección de DGA de larga cola


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Estrategia de ataque
Botnets
Algoritmo de Generación de Dominios
Modelos de aprendizaje profundo
Nombres de dominio DGA
Aprendizaje por transferencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 36

Citaciones: Sin citaciones


Descripción
Como la estrategia de ataque más comúnmente utilizada por Botnets, el Algoritmo de Generación de Dominios (DGA) tiene una fuerte invisibilidad y variabilidad. El uso de modelos de aprendizaje profundo para detectar diferentes familias de nombres de dominio DGA puede mejorar la capacidad de defensa de la red contra los hackers. Sin embargo, esta tarea enfrenta un tamaño de muestra extremadamente desequilibrado entre las diferentes categorías de DGA, lo que conduce a una baja precisión de clasificación para las categorías de muestra pequeña e incluso a fallas de clasificación para algunas categorías. Para abordar este problema, introducimos el concepto de larga cola y aumentamos los datos de las categorías de muestra pequeña mediante la transferencia de conocimientos pre-entrenados. En primer lugar, proponemos el Método de Revisión de Datos Equilibrados (DBRM) para reducir la diferencia de tamaño de muestra entre las categorías, generando así un conjunto de datos relativamente equilibrado para el aprendizaje por transferencia. En segundo lugar, proponemos el Modelo de Transferencia de Conocimiento (KTM) para mejorar el conocimiento de las categorías de muestra pequeña. KTM utiliza una transferencia de múltiples etapas para transferir pesos de las categorías de muestra grande a las categorías de muestra pequeña. Además, proponemos el Modelo de Transferencia de Destilación de Conocimiento (KDTM) para aliviar el problema de olvido catastrófico causado por el aprendizaje por transferencia, que agrega una pérdida de destilación de conocimiento basada en el KTM. Los resultados experimentales muestran que KDTM puede mejorar significativamente el rendimiento de clasificación de todas las categorías, especialmente las categorías de muestra pequeña. Puede lograr un puntaje F1 promedio macro de vanguardia del 84.5%. La robustez del modelo KDTM se verifica utilizando tres conjuntos de datos de DGA que siguen las distribuciones de Pareto.

Otros recursos que podrían interesarte

Temas Virtualpro