logo móvil
Contáctanos

Presentando el conjunto de datos UWF-ZeekDataFall22 para clasificar tácticas de ataque a partir de registros de conexión de Zeek utilizando el aprendizaje automático de Spark en un marco de datos masivos

Autores: Bagui, Sikha S.; Mink, Dustin; Bagui, Subhash C.; Madhyala, Pooja; Uppal, Neha; McElroy, Tom; Plenkers, Russell; Elam, Marshall; Prayaga, Swathi

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Presentando el conjunto de datos UWF-ZeekDataFall22 para clasificar tácticas de ataque a partir de registros de conexión de Zeek utilizando el aprendizaje automático de Spark en un marco de datos masivos


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Introduce
Conjunto de datos
Marco MITRE ATT&CK
Clasificación
Registros de conexión de Zeek
Apache Spark

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones


Descripción
Este estudio presenta UWF-ZeekDataFall22, un conjunto de datos recién creado etiquetado utilizando el marco MITRE ATT&CK. Aunque el enfoque de esta investigación es la clasificación de la táctica de desarrollo de recursos nunca antes clasificada, las tácticas de reconocimiento y descubrimiento también fueron clasificadas. Los resultados también se compararon con un conjunto de datos creado de manera similar, UWF-ZeekData22, creado en 2022. Ambos conjuntos de datos, UWF-ZeekDataFall22 y UWF-ZeekData22, creados utilizando registros de conexión de Zeek, se almacenaron en un marco de Big Data, Hadoop. Para la clasificación de aprendizaje automático, se utilizó Apache Spark en el marco de Big Data. En resumen, la singularidad de este trabajo radica en su enfoque en la clasificación de tácticas de ataque. Para UWF-ZeekdataFall22, se compararon los resultados del clasificador binario y del multinomial, y en general, los resultados del clasificador binario fueron mejores que los del clasificador multinomial. En la clasificación binaria, los clasificadores basados en árboles tuvieron un mejor rendimiento que los otros clasificadores, aunque los algoritmos de árbol de decisión y bosque aleatorio también tuvieron un rendimiento casi igualmente bueno en la clasificación multinomial. Teniendo en cuenta el tiempo de entrenamiento, los árboles de decisión pueden considerarse el clasificador más eficiente.

Otros recursos que podrían interesarte

Temas Virtualpro