Un estudio empírico de la detección de ataques SS7 basada en aprendizaje profundo
Autores: Guo, Yuejun; Ermis, Orhan; Tang, Qiang; Trang, Hoang; De Oliveira, Alexandre
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un estudio empírico de la detección de ataques SS7 basada en aprendizaje profundo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Protocolos de señalización
SS7
Diámetro
Protocolo de Túnel GPRS
Ataques
Aprendizaje profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los protocolos de señalización son responsables de tareas fundamentales como iniciar y terminar la comunicación e identificar el estado de la comunicación en las redes centrales de telecomunicaciones. El Sistema de Señalización Número 7 (SS7), Diameter y el Protocolo de Túnel GPRS (GTP) son los principales protocolos utilizados en 2G a 4G, mientras que 5G utiliza protocolos de Internet estándar para su señalización. A pesar de sus características distintas, y especialmente de sus garantías de seguridad, son los más vulnerables a ataques en escenarios de itinerancia: los ataques que apuntan a la función de actualización de ubicación para suscriptores que se encuentran en una red visitante. La literatura nos dice que los mecanismos de detección basados en reglas son ineficaces contra tales ataques, mientras que la esperanza radica en soluciones basadas en aprendizaje profundo (DL). En este artículo, proporcionamos un estudio empírico a gran escala de modelos DL de vanguardia, incluyendo ocho supervisados y cinco semi-supervisados, para detectar ataques en el escenario de itinerancia. Nuestros experimentos utilizan un conjunto de datos del mundo real y un conjunto de datos simulado para SS7, y pueden llevarse a cabo de manera sencilla para otros protocolos de señalización una vez que estén disponibles los conjuntos de datos correspondientes. Los resultados muestran que los modelos DL semi-supervisados generalmente superan a los supervisados, ya que aprovechan tanto datos etiquetados como no etiquetados para el entrenamiento. Sin embargo, el modelo supervisado basado en ensamblaje NODE supera a otros en su categoría y a algunos en la categoría semi-supervisada. Entre todos, el modelo semi-supervisado PReNet es el que mejor rendimiento tiene en cuanto a las métricas de Recall y F1 cuando se utilizan todos los datos no etiquetados para el entrenamiento, y también es el más estable. Nuestro experimento también muestra que el rendimiento de diferentes modelos semi-supervisados puede variar mucho en función del tamaño de los datos no etiquetados utilizados en el entrenamiento.
Descripción
Los protocolos de señalización son responsables de tareas fundamentales como iniciar y terminar la comunicación e identificar el estado de la comunicación en las redes centrales de telecomunicaciones. El Sistema de Señalización Número 7 (SS7), Diameter y el Protocolo de Túnel GPRS (GTP) son los principales protocolos utilizados en 2G a 4G, mientras que 5G utiliza protocolos de Internet estándar para su señalización. A pesar de sus características distintas, y especialmente de sus garantías de seguridad, son los más vulnerables a ataques en escenarios de itinerancia: los ataques que apuntan a la función de actualización de ubicación para suscriptores que se encuentran en una red visitante. La literatura nos dice que los mecanismos de detección basados en reglas son ineficaces contra tales ataques, mientras que la esperanza radica en soluciones basadas en aprendizaje profundo (DL). En este artículo, proporcionamos un estudio empírico a gran escala de modelos DL de vanguardia, incluyendo ocho supervisados y cinco semi-supervisados, para detectar ataques en el escenario de itinerancia. Nuestros experimentos utilizan un conjunto de datos del mundo real y un conjunto de datos simulado para SS7, y pueden llevarse a cabo de manera sencilla para otros protocolos de señalización una vez que estén disponibles los conjuntos de datos correspondientes. Los resultados muestran que los modelos DL semi-supervisados generalmente superan a los supervisados, ya que aprovechan tanto datos etiquetados como no etiquetados para el entrenamiento. Sin embargo, el modelo supervisado basado en ensamblaje NODE supera a otros en su categoría y a algunos en la categoría semi-supervisada. Entre todos, el modelo semi-supervisado PReNet es el que mejor rendimiento tiene en cuanto a las métricas de Recall y F1 cuando se utilizan todos los datos no etiquetados para el entrenamiento, y también es el más estable. Nuestro experimento también muestra que el rendimiento de diferentes modelos semi-supervisados puede variar mucho en función del tamaño de los datos no etiquetados utilizados en el entrenamiento.