WordDGA: Nombres de dominio a nivel de palabra basados en conocimiento híbrido contra clasificadores DGA y DGAs adversariales
Autores: Selvaraj, Sarojini; Panjanathan, Rukmani
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
WordDGA: Nombres de dominio a nivel de palabra basados en conocimiento híbrido contra clasificadores DGA y DGAs adversariales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Algoritmo de generación de dominios
Dga
Agds
Aprendizaje profundo
Worddga
Híbrido rcnn-bilstm
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Un Algoritmo de Generación de Dominios (DGA) emplea botnets para generar nombres de dominio a través de un enlace de comunicación entre el servidor C&C y los bots. Un DGA puede generar AGDs (dominios generados algorítmicamente) pseudo-aleatorios de manera regular, un método útil para detectar bots en el servidor C&C. A diferencia de los métodos actuales de detección de DGA, los AGDs pueden ser identificados con tecnología ligera y prometedora. Los DGAs pueden prolongar la vida de una operación viral, mejorando su rentabilidad. Investigaciones recientes sobre la sensibilidad del aprendizaje profundo a varios DGAs adversariales han buscado mejorar las técnicas de detección de DGA. Tienen clasificadores a nivel de caracteres y palabras; los clasificadores a nivel híbrido pueden detectar y clasificar AGDs generados por DGAs, disminuyendo significativamente la efectividad de los clasificadores de DGA. Este trabajo presenta WordDGA, un DGA adversarial híbrido basado en RCNN-BiLSTM con fuertes capacidades de anti-detección basadas en NLP y cWGAN, que ofrece técnicas de evasión a nivel de palabra e híbrido. Inicialmente modela las relaciones semánticas entre dominios benignos y DGA construyendo un modelo de predicción con una red híbrida RCNN-BiLSTM. Para optimizar la similitud entre los nombres de dominio benignos y DGA, modifica frases de cada dominio de entrada utilizando el modelo de predicción para detectar categorizaciones de familias DGA. Los resultados experimentales revelan que esquivar numerosas listas de palabras y clasificadores DGA de nivel mixto con conjuntos de entrenamiento y prueba mejora la tasa de repetición de palabras, la tasa de colisión de dominios, la tasa de éxito de ataque y la tasa de detección, indicando la utilidad del sobremuestreo basado en cWGAN frente a DGAs adversariales.
Descripción
Un Algoritmo de Generación de Dominios (DGA) emplea botnets para generar nombres de dominio a través de un enlace de comunicación entre el servidor C&C y los bots. Un DGA puede generar AGDs (dominios generados algorítmicamente) pseudo-aleatorios de manera regular, un método útil para detectar bots en el servidor C&C. A diferencia de los métodos actuales de detección de DGA, los AGDs pueden ser identificados con tecnología ligera y prometedora. Los DGAs pueden prolongar la vida de una operación viral, mejorando su rentabilidad. Investigaciones recientes sobre la sensibilidad del aprendizaje profundo a varios DGAs adversariales han buscado mejorar las técnicas de detección de DGA. Tienen clasificadores a nivel de caracteres y palabras; los clasificadores a nivel híbrido pueden detectar y clasificar AGDs generados por DGAs, disminuyendo significativamente la efectividad de los clasificadores de DGA. Este trabajo presenta WordDGA, un DGA adversarial híbrido basado en RCNN-BiLSTM con fuertes capacidades de anti-detección basadas en NLP y cWGAN, que ofrece técnicas de evasión a nivel de palabra e híbrido. Inicialmente modela las relaciones semánticas entre dominios benignos y DGA construyendo un modelo de predicción con una red híbrida RCNN-BiLSTM. Para optimizar la similitud entre los nombres de dominio benignos y DGA, modifica frases de cada dominio de entrada utilizando el modelo de predicción para detectar categorizaciones de familias DGA. Los resultados experimentales revelan que esquivar numerosas listas de palabras y clasificadores DGA de nivel mixto con conjuntos de entrenamiento y prueba mejora la tasa de repetición de palabras, la tasa de colisión de dominios, la tasa de éxito de ataque y la tasa de detección, indicando la utilidad del sobremuestreo basado en cWGAN frente a DGAs adversariales.