Un Método de Fusión de Características Semánticas de Múltiples Ángulos para la Detección de Anomalías en el Comportamiento de Usuarios Web
Autores: Wang, Li; Xia, Mingshan; Li, Yakang; Xu, Jiahong; Hou, Fengyao; Qi, Fazhi
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un Método de Fusión de Características Semánticas de Múltiples Ángulos para la Detección de Anomalías en el Comportamiento de Usuarios Web
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aumento de complejidad
Detección de anomalías en el comportamiento del usuario web
Información semántica faltante
Enfoque de fusión de características semánticas desde múltiples ángulos
Sesiones de usuario
Comportamiento de secuencia de acceso
Contenido semántico
Modelo Transformer de atención múltiple
Modelo de extremo a extremo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para abordar la creciente complejidad de la detección de anomalías en el comportamiento de los usuarios en la web y el problema de la falta de información semántica causado por depender únicamente de características como la semántica de las solicitudes o las secuencias de solicitudes, este estudio propone un enfoque de fusión de características semánticas desde múltiples ángulos para la detección de anomalías en el comportamiento del usuario. La investigación se basa en las sesiones de usuario. En primer lugar, al analizar el comportamiento de la secuencia de acceso dentro de las sesiones de usuario y utilizar un algoritmo SimHash mejorado, se extraen características de secuencia para modelar los patrones de navegación. En segundo lugar, combinando el contenido semántico contenido en las sesiones de usuario, se emplea un modelo Transformer de atención múltiple para extraer características semánticas, representando la semántica de las visitas de los usuarios. Finalmente, se construye un modelo de extremo a extremo para fusionar características de secuencia y semánticas, lo que permite una detección efectiva de anomalías en el comportamiento del usuario. Los resultados experimentales demuestran que el modelo propuesto exhibe un excelente rendimiento y estabilidad en la precisión de detección, con efectos significativos en la identificación de usuarios anómalos en el mundo real. A medida que aumenta la proporción de sesiones anómalas, la precisión, el recall y la puntuación F1 también mejoran, alcanzando todos el 99%. Incluso cuando las sesiones anómalas son escasas en el conjunto de datos, el modelo aún logra resultados de detección satisfactorios.
Descripción
Para abordar la creciente complejidad de la detección de anomalías en el comportamiento de los usuarios en la web y el problema de la falta de información semántica causado por depender únicamente de características como la semántica de las solicitudes o las secuencias de solicitudes, este estudio propone un enfoque de fusión de características semánticas desde múltiples ángulos para la detección de anomalías en el comportamiento del usuario. La investigación se basa en las sesiones de usuario. En primer lugar, al analizar el comportamiento de la secuencia de acceso dentro de las sesiones de usuario y utilizar un algoritmo SimHash mejorado, se extraen características de secuencia para modelar los patrones de navegación. En segundo lugar, combinando el contenido semántico contenido en las sesiones de usuario, se emplea un modelo Transformer de atención múltiple para extraer características semánticas, representando la semántica de las visitas de los usuarios. Finalmente, se construye un modelo de extremo a extremo para fusionar características de secuencia y semánticas, lo que permite una detección efectiva de anomalías en el comportamiento del usuario. Los resultados experimentales demuestran que el modelo propuesto exhibe un excelente rendimiento y estabilidad en la precisión de detección, con efectos significativos en la identificación de usuarios anómalos en el mundo real. A medida que aumenta la proporción de sesiones anómalas, la precisión, el recall y la puntuación F1 también mejoran, alcanzando todos el 99%. Incluso cuando las sesiones anómalas son escasas en el conjunto de datos, el modelo aún logra resultados de detección satisfactorios.