Mejora del rendimiento de los sistemas de detección de intrusiones con el análisis de datos UNSW-NB15
Autores: More, Shweta; Idrissi, Moad; Mahmoud, Haitham; Asyhari, A. Taufiq
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejora del rendimiento de los sistemas de detección de intrusiones con el análisis de datos UNSW-NB15
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Tecnologías
Ciberseguridad
Sistemas de detección de intrusiones
Análisis de datos
Aprendizaje automático
Ciberataques
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 44
Citaciones: Sin citaciones
La rápida proliferación de nuevas tecnologías como Internet de las Cosas (IoT), computación en la nube, virtualización y dispositivos inteligentes ha llevado a una producción anual masiva de más de 400 zetabytes de datos de tráfico de red. Como resultado, es crucial que las empresas implementen medidas sólidas de ciberseguridad para proteger los datos sensibles de intrusiones, que pueden provocar pérdidas financieras significativas. Los sistemas de detección de intrusiones (IDS) existentes requieren mejoras adicionales para reducir los falsos positivos y mejorar la precisión general. Para minimizar los riesgos de seguridad, se pueden utilizar análisis de datos y aprendizaje automático para crear recomendaciones y decisiones basadas en datos de entrada. Este estudio se centra en desarrollar modelos de aprendizaje automático que puedan identificar ciberataques y mejorar el rendimiento del sistema IDS. Este documento empleó regresión logística, máquina de vectores de soporte, árbol de decisión y algoritmos de bosque aleatorio en el conjunto de datos de tráfico de red UNSW-NB15, utilizando un análisis de datos exploratorio en profundidad y selección de características utilizando análisis de correlación y muestreo aleatorio para comparar la precisión y efectividad del modelo. Los resultados de la matriz de rendimiento y confusión indican que el modelo de Bosque Aleatorio es la mejor opción para identificar ciberataques, con un notable puntaje F1 del 97.80%, precisión del 98.63% y una baja tasa de falsas alarmas del 1.36%, por lo que debería considerarse para mejorar la seguridad del sistema IDS.
Descripción
La rápida proliferación de nuevas tecnologías como Internet de las Cosas (IoT), computación en la nube, virtualización y dispositivos inteligentes ha llevado a una producción anual masiva de más de 400 zetabytes de datos de tráfico de red. Como resultado, es crucial que las empresas implementen medidas sólidas de ciberseguridad para proteger los datos sensibles de intrusiones, que pueden provocar pérdidas financieras significativas. Los sistemas de detección de intrusiones (IDS) existentes requieren mejoras adicionales para reducir los falsos positivos y mejorar la precisión general. Para minimizar los riesgos de seguridad, se pueden utilizar análisis de datos y aprendizaje automático para crear recomendaciones y decisiones basadas en datos de entrada. Este estudio se centra en desarrollar modelos de aprendizaje automático que puedan identificar ciberataques y mejorar el rendimiento del sistema IDS. Este documento empleó regresión logística, máquina de vectores de soporte, árbol de decisión y algoritmos de bosque aleatorio en el conjunto de datos de tráfico de red UNSW-NB15, utilizando un análisis de datos exploratorio en profundidad y selección de características utilizando análisis de correlación y muestreo aleatorio para comparar la precisión y efectividad del modelo. Los resultados de la matriz de rendimiento y confusión indican que el modelo de Bosque Aleatorio es la mejor opción para identificar ciberataques, con un notable puntaje F1 del 97.80%, precisión del 98.63% y una baja tasa de falsas alarmas del 1.36%, por lo que debería considerarse para mejorar la seguridad del sistema IDS.