Presentando el conjunto de datos UWF-ZeekDataFall22 para clasificar tácticas de ataque a partir de registros de conexión de Zeek utilizando el aprendizaje automático de Spark en un marco de datos masivos
Autores: Bagui, Sikha S.; Mink, Dustin; Bagui, Subhash C.; Madhyala, Pooja; Uppal, Neha; McElroy, Tom; Plenkers, Russell; Elam, Marshall; Prayaga, Swathi
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Presentando el conjunto de datos UWF-ZeekDataFall22 para clasificar tácticas de ataque a partir de registros de conexión de Zeek utilizando el aprendizaje automático de Spark en un marco de datos masivos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Introduce
Conjunto de datos
Marco MITRE ATT&CK
Clasificación
Registros de conexión de Zeek
Apache Spark
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Este estudio presenta UWF-ZeekDataFall22, un conjunto de datos recién creado etiquetado utilizando el marco MITRE ATT&CK. Aunque el enfoque de esta investigación es la clasificación de la táctica de desarrollo de recursos nunca antes clasificada, las tácticas de reconocimiento y descubrimiento también fueron clasificadas. Los resultados también se compararon con un conjunto de datos creado de manera similar, UWF-ZeekData22, creado en 2022. Ambos conjuntos de datos, UWF-ZeekDataFall22 y UWF-ZeekData22, creados utilizando registros de conexión de Zeek, se almacenaron en un marco de Big Data, Hadoop. Para la clasificación de aprendizaje automático, se utilizó Apache Spark en el marco de Big Data. En resumen, la singularidad de este trabajo radica en su enfoque en la clasificación de tácticas de ataque. Para UWF-ZeekdataFall22, se compararon los resultados del clasificador binario y del multinomial, y en general, los resultados del clasificador binario fueron mejores que los del clasificador multinomial. En la clasificación binaria, los clasificadores basados en árboles tuvieron un mejor rendimiento que los otros clasificadores, aunque los algoritmos de árbol de decisión y bosque aleatorio también tuvieron un rendimiento casi igualmente bueno en la clasificación multinomial. Teniendo en cuenta el tiempo de entrenamiento, los árboles de decisión pueden considerarse el clasificador más eficiente.
Descripción
Este estudio presenta UWF-ZeekDataFall22, un conjunto de datos recién creado etiquetado utilizando el marco MITRE ATT&CK. Aunque el enfoque de esta investigación es la clasificación de la táctica de desarrollo de recursos nunca antes clasificada, las tácticas de reconocimiento y descubrimiento también fueron clasificadas. Los resultados también se compararon con un conjunto de datos creado de manera similar, UWF-ZeekData22, creado en 2022. Ambos conjuntos de datos, UWF-ZeekDataFall22 y UWF-ZeekData22, creados utilizando registros de conexión de Zeek, se almacenaron en un marco de Big Data, Hadoop. Para la clasificación de aprendizaje automático, se utilizó Apache Spark en el marco de Big Data. En resumen, la singularidad de este trabajo radica en su enfoque en la clasificación de tácticas de ataque. Para UWF-ZeekdataFall22, se compararon los resultados del clasificador binario y del multinomial, y en general, los resultados del clasificador binario fueron mejores que los del clasificador multinomial. En la clasificación binaria, los clasificadores basados en árboles tuvieron un mejor rendimiento que los otros clasificadores, aunque los algoritmos de árbol de decisión y bosque aleatorio también tuvieron un rendimiento casi igualmente bueno en la clasificación multinomial. Teniendo en cuenta el tiempo de entrenamiento, los árboles de decisión pueden considerarse el clasificador más eficiente.