Drnet: reentrenamiento dinámico para tráfico malicioso de aprendizaje incremental de pequeñas muestras
Autores: Wang, Ruonan; Fei, Jinlong; Zhang, Rongkai; Guo, Maohua; Qi, Zan; Li, Xue
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Drnet: reentrenamiento dinámico para tráfico malicioso de aprendizaje incremental de pequeñas muestras
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Clasificación de tráfico
Aprendizaje incremental
Muestra pequeña
Tráfico malicioso
Red neuronal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
El aprendizaje profundo ha logrado buenos resultados de clasificación en el campo de la clasificación de tráfico en los últimos años debido a su buena capacidad de representación de características. Sin embargo, la tecnología existente de clasificación de tráfico no puede satisfacer los requisitos para el aprendizaje incremental de tareas en escenarios en línea. Además, debido a la alta ocultación y la rápida velocidad de actualización del tráfico malicioso, la cantidad de muestras etiquetadas que se pueden capturar es escasa, y las muestras pequeñas no pueden impulsar el entrenamiento de la red neuronal, lo que resulta en un mal rendimiento del modelo de clasificación. Por lo tanto, este documento propone un método de aprendizaje incremental para la clasificación de tráfico malicioso de muestras pequeñas. El método utiliza la estrategia de poda para encontrar la estructura de red redundante y asigna dinámicamente neuronas redundantes para el entrenamiento basado en el método de medición propuesto de acuerdo con la dificultad de la nueva clase. Esto permite que la red realice un aprendizaje incremental sin consumir excesivamente recursos de almacenamiento y computación, y una asignación razonable mejora la precisión de clasificación de las nuevas clases. Al mismo tiempo, a través del método de transferencia de conocimiento, el modelo puede reducir el olvido catastrófico de la clase antigua, aliviar la presión de entrenar grandes parámetros con datos de muestras pequeñas y mejorar el rendimiento de clasificación del modelo. Experimentos que involucran múltiples conjuntos de datos y configuraciones muestran que nuestro método es superior al punto de referencia establecido en términos de precisión de clasificación, consumiendo un 50% menos de memoria.
Descripción
El aprendizaje profundo ha logrado buenos resultados de clasificación en el campo de la clasificación de tráfico en los últimos años debido a su buena capacidad de representación de características. Sin embargo, la tecnología existente de clasificación de tráfico no puede satisfacer los requisitos para el aprendizaje incremental de tareas en escenarios en línea. Además, debido a la alta ocultación y la rápida velocidad de actualización del tráfico malicioso, la cantidad de muestras etiquetadas que se pueden capturar es escasa, y las muestras pequeñas no pueden impulsar el entrenamiento de la red neuronal, lo que resulta en un mal rendimiento del modelo de clasificación. Por lo tanto, este documento propone un método de aprendizaje incremental para la clasificación de tráfico malicioso de muestras pequeñas. El método utiliza la estrategia de poda para encontrar la estructura de red redundante y asigna dinámicamente neuronas redundantes para el entrenamiento basado en el método de medición propuesto de acuerdo con la dificultad de la nueva clase. Esto permite que la red realice un aprendizaje incremental sin consumir excesivamente recursos de almacenamiento y computación, y una asignación razonable mejora la precisión de clasificación de las nuevas clases. Al mismo tiempo, a través del método de transferencia de conocimiento, el modelo puede reducir el olvido catastrófico de la clase antigua, aliviar la presión de entrenar grandes parámetros con datos de muestras pequeñas y mejorar el rendimiento de clasificación del modelo. Experimentos que involucran múltiples conjuntos de datos y configuraciones muestran que nuestro método es superior al punto de referencia establecido en términos de precisión de clasificación, consumiendo un 50% menos de memoria.