Bae: algoritmo de detección de anomalías basado en agrupamiento y autoencoder
Autores: Wang, Dongqi; Nie, Mingshuo; Chen, Dongming
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Bae: algoritmo de detección de anomalías basado en agrupamiento y autoencoder
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Detección de valores atípicos
Anomalías en el tráfico de red
Algoritmo de agrupamiento
Modelo de autoencoder
BIRCH-Autoencoder
Conjuntos de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
En este documento, proponemos un algoritmo de detección de valores atípicos para detectar anomalías en el tráfico de red basado en un algoritmo de clustering y un modelo de autoencoder. El algoritmo de clustering BIRCH se emplea como pre-algoritmo del autoencoder para pre-clasificar conjuntos de datos con características de distribución de datos complejas, mientras que el modelo de autoencoder se utiliza para detectar valores atípicos basados en un umbral. El algoritmo propuesto BIRCH-Autoencoder (BAE) ha sido probado en cuatro conjuntos de datos de seguridad de red, KDDCUP99, UNSW-NB15, CICIDS2017 y NSL-KDD, y comparado con algoritmos representativos. El algoritmo BAE logró puntajes F promedio de 96.160, 81.132 y 91.424 en los conjuntos de datos KDDCUP99, UNSW-NB15 y CICIDS2017, respectivamente. Estos resultados experimentales demuestran que el enfoque propuesto puede detectar datos anómalos de manera efectiva y precisa.
Descripción
En este documento, proponemos un algoritmo de detección de valores atípicos para detectar anomalías en el tráfico de red basado en un algoritmo de clustering y un modelo de autoencoder. El algoritmo de clustering BIRCH se emplea como pre-algoritmo del autoencoder para pre-clasificar conjuntos de datos con características de distribución de datos complejas, mientras que el modelo de autoencoder se utiliza para detectar valores atípicos basados en un umbral. El algoritmo propuesto BIRCH-Autoencoder (BAE) ha sido probado en cuatro conjuntos de datos de seguridad de red, KDDCUP99, UNSW-NB15, CICIDS2017 y NSL-KDD, y comparado con algoritmos representativos. El algoritmo BAE logró puntajes F promedio de 96.160, 81.132 y 91.424 en los conjuntos de datos KDDCUP99, UNSW-NB15 y CICIDS2017, respectivamente. Estos resultados experimentales demuestran que el enfoque propuesto puede detectar datos anómalos de manera efectiva y precisa.