Magneto y DeepInsight: traducción de imágenes extendida con relaciones semánticas para clasificar datos de ataque con modelos de aprendizaje automático
Autores: Dunmore, Aeryn; Dunning, Adam; Jang-Jaccard, Julian; Sabrina, Fariza; Kwak, Jin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Magneto y DeepInsight: traducción de imágenes extendida con relaciones semánticas para clasificar datos de ataque con modelos de aprendizaje automático
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Clasificación de imágenes de tráfico de red en DeepInsight
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La traducción de datos de flujo de tráfico en imágenes con el propósito de clasificación en tareas de aprendizaje automático ha sido ampliamente explorada en los últimos años. Sin embargo, el método de traducción tiene un impacto significativo en el éxito de tales intentos. En 2019, se desarrolló un método llamado DeepInsight para traducir información genética en imágenes. Luego, en 2021, se adoptó con el propósito de traducir el tráfico de red en imágenes, permitiendo la retención de datos semánticos sobre las relaciones entre características, en un modelo llamado MAGNETO. En este documento, exploramos y ampliamos esta investigación, utilizando el algoritmo MAGNETO en tres nuevos conjuntos de datos de detección de intrusiones: CICDDoS2019, 5G-NIDD y BOT-IoT, y también ampliamos este método al ámbito de tareas de clasificación multiclase utilizando primero un modelo Uno contra el Resto, seguido por una tarea de clasificación multiclase completa, utilizando múltiples nuevos clasificadores para compararlos con las CNN implementadas por el modelo original de MAGNETO. También hemos realizado experimentos comparativos en los conjuntos de datos originales de MAGNETO, CICIDS17, KDD99 y UNSW-NB15, así como una comparación con otros modelos de vanguardia utilizando el conjunto de datos NSL-KDD. Los resultados muestran que el algoritmo MAGNETO y el método de traducción DeepInsight, sin el uso de aumento de datos, ofrecen un impulso significativo a la precisión al clasificar datos de tráfico de red. Nuestra investigación también muestra la efectividad de los clasificadores de Árbol de Decisión y Bosque Aleatorio en este tipo de datos. Se necesita más investigación sobre el potencial de ejecución en tiempo real para explorar las posibilidades de extender este método de traducción a escenarios del mundo real.
Descripción
La traducción de datos de flujo de tráfico en imágenes con el propósito de clasificación en tareas de aprendizaje automático ha sido ampliamente explorada en los últimos años. Sin embargo, el método de traducción tiene un impacto significativo en el éxito de tales intentos. En 2019, se desarrolló un método llamado DeepInsight para traducir información genética en imágenes. Luego, en 2021, se adoptó con el propósito de traducir el tráfico de red en imágenes, permitiendo la retención de datos semánticos sobre las relaciones entre características, en un modelo llamado MAGNETO. En este documento, exploramos y ampliamos esta investigación, utilizando el algoritmo MAGNETO en tres nuevos conjuntos de datos de detección de intrusiones: CICDDoS2019, 5G-NIDD y BOT-IoT, y también ampliamos este método al ámbito de tareas de clasificación multiclase utilizando primero un modelo Uno contra el Resto, seguido por una tarea de clasificación multiclase completa, utilizando múltiples nuevos clasificadores para compararlos con las CNN implementadas por el modelo original de MAGNETO. También hemos realizado experimentos comparativos en los conjuntos de datos originales de MAGNETO, CICIDS17, KDD99 y UNSW-NB15, así como una comparación con otros modelos de vanguardia utilizando el conjunto de datos NSL-KDD. Los resultados muestran que el algoritmo MAGNETO y el método de traducción DeepInsight, sin el uso de aumento de datos, ofrecen un impulso significativo a la precisión al clasificar datos de tráfico de red. Nuestra investigación también muestra la efectividad de los clasificadores de Árbol de Decisión y Bosque Aleatorio en este tipo de datos. Se necesita más investigación sobre el potencial de ejecución en tiempo real para explorar las posibilidades de extender este método de traducción a escenarios del mundo real.