Selección de características numéricas y escalado de características tangente hiperbólica en detección basada en aprendizaje automático de anomalías en el comportamiento de la red informática
Autores: Proti, Danijela; Stankovi, Miomir; Prodanovi, Radomir; Vuli, Ivan; Stojanovi, Goran M.; Simi, Mitar; Ostoji, Gordana; Stankovski, Stevan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Selección de características numéricas y escalado de características tangente hiperbólica en detección basada en aprendizaje automático de anomalías en el comportamiento de la red informática
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Anomalía
Sistemas de detección de intrusiones
Aprendizaje supervisado
Selección de características
Escalado de características
Clasificadores
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Los sistemas de detección de intrusiones basados en anomalías identifican el comportamiento de la red informática que se desvía del modelo estadístico del comportamiento de red típico. Los clasificadores binarios basados en aprendizaje automático supervisado son muy precisos para clasificar los datos de red en dos categorías: tráfico normal y actividad anómala. La mayoría de los problemas con el aprendizaje supervisado están relacionados con la gran cantidad de datos necesarios para entrenar los clasificadores. La selección de características se puede utilizar para reducir los conjuntos de datos. El objetivo de la selección de características es seleccionar un subconjunto de características de entrada relevantes para optimizar la evaluación y mejorar el rendimiento de un clasificador dado. El escalado de características normaliza todas las características al mismo rango, evitando que el tamaño grande de las características afecte a los modelos de clasificación u otras características. Los modelos de aprendizaje automático supervisado más comúnmente utilizados, incluidos los árboles de decisión, la máquina de vectores de soporte, los vecinos más cercanos, los vecinos más cercanos ponderados y la red neuronal feedforward, pueden mejorarse utilizando la selección de características y el escalado de características. Este documento presenta una nueva técnica de escalado de características basada en una función tangente hiperbólica y una estrategia de amortiguación del algoritmo de Levenberg-Marquardt.
Descripción
Los sistemas de detección de intrusiones basados en anomalías identifican el comportamiento de la red informática que se desvía del modelo estadístico del comportamiento de red típico. Los clasificadores binarios basados en aprendizaje automático supervisado son muy precisos para clasificar los datos de red en dos categorías: tráfico normal y actividad anómala. La mayoría de los problemas con el aprendizaje supervisado están relacionados con la gran cantidad de datos necesarios para entrenar los clasificadores. La selección de características se puede utilizar para reducir los conjuntos de datos. El objetivo de la selección de características es seleccionar un subconjunto de características de entrada relevantes para optimizar la evaluación y mejorar el rendimiento de un clasificador dado. El escalado de características normaliza todas las características al mismo rango, evitando que el tamaño grande de las características afecte a los modelos de clasificación u otras características. Los modelos de aprendizaje automático supervisado más comúnmente utilizados, incluidos los árboles de decisión, la máquina de vectores de soporte, los vecinos más cercanos, los vecinos más cercanos ponderados y la red neuronal feedforward, pueden mejorarse utilizando la selección de características y el escalado de características. Este documento presenta una nueva técnica de escalado de características basada en una función tangente hiperbólica y una estrategia de amortiguación del algoritmo de Levenberg-Marquardt.