Detección de intrusiones basada en aprendizaje automático para ataques de red de clases raras
Autores: Yang, Yu; Gu, Yuheng; Yan, Yu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de intrusiones basada en aprendizaje automático para ataques de red de clases raras
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Propuesto
Técnica de sobremuestreo minoritario sintético geométrico
Algoritmo de estimación de densidad de núcleo optimizado
Módulo de extracción de características
Autoencoders de eliminación de ruido
Técnica de aprendizaje de conjunto de votación suave
Sistema de detección de intrusiones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Debido al desequilibrio severo en las cantidades de muestras normales y muestras de ataque, así como entre diferentes tipos de muestras de ataque, los sistemas de detección de intrusiones sufren de bajas tasas de detección para datos de ataques de clase rara. En este documento, proponemos una técnica de sobremuestreo sintético de minorías geométricas basada en el algoritmo de estimación de densidad del núcleo optimizado. Este método puede generar diversos datos de ataque de clase rara aprendiendo la distribución de datos de ataque de clase rara mientras mantiene similitud con las características de las muestras originales. Mientras tanto, los datos equilibrados se introducen en un módulo de extracción de características construido sobre múltiples autoencoders de desruido, reduciendo la redundancia de información en datos de alta dimensión y mejorando el rendimiento de detección para ataques desconocidos. Posteriormente, se utiliza una técnica de aprendizaje de conjunto de votación suave para la detección de anomalías multiclase en los datos equilibrados y dimensionalmente reducidos. Finalmente, se construye un sistema de detección de intrusiones basado en módulos de preprocesamiento de datos, manejo de desequilibrios, extracción de características y detección de anomalías. El rendimiento del sistema fue evaluado utilizando dos conjuntos de datos, NSL-KDD y N-BaIoT, logrando una precisión de multiclase del 86.39% y 99.94%, respectivamente. A través de experimentos de ablación y comparación con el modelo base, se encuentra que las limitaciones inherentes de un solo modelo de aprendizaje automático afectan directamente la precisión del sistema de detección de intrusiones, mientras que se demuestra la superioridad del modelo multi-módulo propuesto en la detección de ataques desconocidos y clases raras de tráfico de ataque.
Descripción
Debido al desequilibrio severo en las cantidades de muestras normales y muestras de ataque, así como entre diferentes tipos de muestras de ataque, los sistemas de detección de intrusiones sufren de bajas tasas de detección para datos de ataques de clase rara. En este documento, proponemos una técnica de sobremuestreo sintético de minorías geométricas basada en el algoritmo de estimación de densidad del núcleo optimizado. Este método puede generar diversos datos de ataque de clase rara aprendiendo la distribución de datos de ataque de clase rara mientras mantiene similitud con las características de las muestras originales. Mientras tanto, los datos equilibrados se introducen en un módulo de extracción de características construido sobre múltiples autoencoders de desruido, reduciendo la redundancia de información en datos de alta dimensión y mejorando el rendimiento de detección para ataques desconocidos. Posteriormente, se utiliza una técnica de aprendizaje de conjunto de votación suave para la detección de anomalías multiclase en los datos equilibrados y dimensionalmente reducidos. Finalmente, se construye un sistema de detección de intrusiones basado en módulos de preprocesamiento de datos, manejo de desequilibrios, extracción de características y detección de anomalías. El rendimiento del sistema fue evaluado utilizando dos conjuntos de datos, NSL-KDD y N-BaIoT, logrando una precisión de multiclase del 86.39% y 99.94%, respectivamente. A través de experimentos de ablación y comparación con el modelo base, se encuentra que las limitaciones inherentes de un solo modelo de aprendizaje automático afectan directamente la precisión del sistema de detección de intrusiones, mientras que se demuestra la superioridad del modelo multi-módulo propuesto en la detección de ataques desconocidos y clases raras de tráfico de ataque.