Las técnicas mejoradas de detección de intrusos en redes utilizando el enfoque de ingeniería de características con clasificadores de refuerzo
Autores: Rai, Hari Mohan; Yoo, Joon; Agarwal, Saurabh
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Las técnicas mejoradas de detección de intrusos en redes utilizando el enfoque de ingeniería de características con clasificadores de refuerzo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Amenazas cibernéticas
Sistema de detección de intrusos basado en red
Ingeniería de características
Modelos de aprendizaje automático de refuerzo
Conjunto de datos
XGBoost
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
En el dominio de la ciberseguridad, las amenazas cibernéticas dirigidas a los dispositivos de red son muy cruciales. Debido al crecimiento exponencial de los dispositivos inalámbricos, como teléfonos inteligentes y dispositivos portátiles, los riesgos cibernéticos se vuelven cada vez más frecuentes y comunes con la aparición de nuevos tipos de amenazas. Esto hace que la detección automática y precisa de intrusiones basadas en la red sea muy esencial. En este trabajo, proponemos un sistema de detección de intrusiones basado en la red que utiliza un enfoque integral de ingeniería de características combinado con modelos de aprendizaje automático (ML) de refuerzo. Se utilizó un conjunto de datos basado en TCP/IP con 25,192 muestras de datos de diferentes protocolos en nuestro trabajo. Para mejorar el conjunto de datos, utilizamos métodos de preprocesamiento como codificación de etiquetas, análisis de correlación, codificación de etiquetas personalizada y codificación de etiquetas iterativa. Para mejorar la precisión del modelo para la predicción, luego utilizamos una metodología de ingeniería de características única que incluía técnicas novedosas de escalado de características y selección de características basadas en bosques aleatorios. Utilizamos tres modelos convencionales (NB, LR y SVC) y cuatro clasificadores de refuerzo (CatBoostGBM, LightGBM, HistGradientBoosting y XGBoost) para la clasificación. Se emplearon métodos de validación cruzada de 10 pliegues para entrenar cada modelo. Después de una evaluación utilizando numerosas métricas, el modelo con mejor rendimiento resultó ser XGBoost. Con valores medios de métricas de 99.54 +/- 0.0007 para precisión, 99.53 +/- 0.0013 para precisión, 99.54 +/- 0.001 para recuperación y un puntaje F1 de 99.53 +/- 0.0014, el modelo XGBoost produjo el mejor rendimiento en general. Además, mostramos la curva ROC para evaluar el modelo, que demostró que todos los clasificadores de refuerzo obtuvieron un valor de AUC perfecto de uno. Nuestras metodologías sugeridas muestran efectividad y precisión en la detección de intrusiones en redes, sentando las bases para que el modelo se utilice en tiempo real. Nuestro método proporciona una medida defensiva sólida contra intrusiones maliciosas en infraestructuras de red mientras las amenazas cibernéticas siguen variando.
Descripción
En el dominio de la ciberseguridad, las amenazas cibernéticas dirigidas a los dispositivos de red son muy cruciales. Debido al crecimiento exponencial de los dispositivos inalámbricos, como teléfonos inteligentes y dispositivos portátiles, los riesgos cibernéticos se vuelven cada vez más frecuentes y comunes con la aparición de nuevos tipos de amenazas. Esto hace que la detección automática y precisa de intrusiones basadas en la red sea muy esencial. En este trabajo, proponemos un sistema de detección de intrusiones basado en la red que utiliza un enfoque integral de ingeniería de características combinado con modelos de aprendizaje automático (ML) de refuerzo. Se utilizó un conjunto de datos basado en TCP/IP con 25,192 muestras de datos de diferentes protocolos en nuestro trabajo. Para mejorar el conjunto de datos, utilizamos métodos de preprocesamiento como codificación de etiquetas, análisis de correlación, codificación de etiquetas personalizada y codificación de etiquetas iterativa. Para mejorar la precisión del modelo para la predicción, luego utilizamos una metodología de ingeniería de características única que incluía técnicas novedosas de escalado de características y selección de características basadas en bosques aleatorios. Utilizamos tres modelos convencionales (NB, LR y SVC) y cuatro clasificadores de refuerzo (CatBoostGBM, LightGBM, HistGradientBoosting y XGBoost) para la clasificación. Se emplearon métodos de validación cruzada de 10 pliegues para entrenar cada modelo. Después de una evaluación utilizando numerosas métricas, el modelo con mejor rendimiento resultó ser XGBoost. Con valores medios de métricas de 99.54 +/- 0.0007 para precisión, 99.53 +/- 0.0013 para precisión, 99.54 +/- 0.001 para recuperación y un puntaje F1 de 99.53 +/- 0.0014, el modelo XGBoost produjo el mejor rendimiento en general. Además, mostramos la curva ROC para evaluar el modelo, que demostró que todos los clasificadores de refuerzo obtuvieron un valor de AUC perfecto de uno. Nuestras metodologías sugeridas muestran efectividad y precisión en la detección de intrusiones en redes, sentando las bases para que el modelo se utilice en tiempo real. Nuestro método proporciona una medida defensiva sólida contra intrusiones maliciosas en infraestructuras de red mientras las amenazas cibernéticas siguen variando.