Mejorando la Síntesis de Trazas de Red que Preservan la Privacidad a Través de Modelos de Difusión Latente
Autores: Yu, Jin-Xi; Xu, Yi-Han; Hua, Min; Yu, Gang; Zhou, Wen
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Mejorando la Síntesis de Trazas de Red que Preservan la Privacidad a Través de Modelos de Difusión Latente
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Traza de red
Paquetes de datos
Direcciones IP
Direcciones MAC
Comportamiento de la red
Síntesis de traza de red
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El seguimiento de red es un registro completo de paquetes de datos que atraviesan una red informática, sirviendo como un recurso crítico para analizar el comportamiento de la red. Sin embargo, en la práctica, la disponibilidad limitada de seguimientos de red de alta calidad, junto con la presencia de información sensible como direcciones IP y direcciones MAC, plantea desafíos significativos para avanzar en el análisis de seguimientos de red. Para abordar estos problemas, este documento se centra en la síntesis de seguimientos de red en dos escenarios prácticos: (1) expansión de datos, donde los usuarios crean seguimientos sintéticos internamente para diversificar y mejorar la utilidad de los seguimientos de red existentes; (2) liberación de datos, donde los seguimientos de red sintetizados se comparten externamente. Inspirado por las poderosas capacidades generativas de los modelos de difusión latente (LDM), este documento presenta NetSynDM, que aprovecha LDM para abordar los desafíos de la síntesis de seguimientos de red en escenarios de expansión de datos. Para abordar los desafíos en el escenario de liberación de datos, integramos mecanismos de privacidad diferencial (DP) en NetSynDM, introduciendo DPNetSynDM, que utiliza DP Stochastic Gradient Descent (DP-SGD) para actualizar NetSynDM, incorporando ruido que preserva la privacidad a lo largo del proceso de entrenamiento. Experimentos en cinco conjuntos de datos de seguimientos de red ampliamente utilizados muestran que nuestros métodos superan trabajos anteriores. NetSynDM logra un rendimiento promedio un 166.1% mejor en fidelidad en comparación con las líneas base. DPNetSynDM logra un mejor equilibrio entre privacidad y fidelidad, superando las puntuaciones de fidelidad del método de síntesis de seguimientos de red de última generación anterior en un 18.4% en UGR16, mientras reduce las puntuaciones de riesgo de privacidad en aproximadamente un 9.79%.
Descripción
El seguimiento de red es un registro completo de paquetes de datos que atraviesan una red informática, sirviendo como un recurso crítico para analizar el comportamiento de la red. Sin embargo, en la práctica, la disponibilidad limitada de seguimientos de red de alta calidad, junto con la presencia de información sensible como direcciones IP y direcciones MAC, plantea desafíos significativos para avanzar en el análisis de seguimientos de red. Para abordar estos problemas, este documento se centra en la síntesis de seguimientos de red en dos escenarios prácticos: (1) expansión de datos, donde los usuarios crean seguimientos sintéticos internamente para diversificar y mejorar la utilidad de los seguimientos de red existentes; (2) liberación de datos, donde los seguimientos de red sintetizados se comparten externamente. Inspirado por las poderosas capacidades generativas de los modelos de difusión latente (LDM), este documento presenta NetSynDM, que aprovecha LDM para abordar los desafíos de la síntesis de seguimientos de red en escenarios de expansión de datos. Para abordar los desafíos en el escenario de liberación de datos, integramos mecanismos de privacidad diferencial (DP) en NetSynDM, introduciendo DPNetSynDM, que utiliza DP Stochastic Gradient Descent (DP-SGD) para actualizar NetSynDM, incorporando ruido que preserva la privacidad a lo largo del proceso de entrenamiento. Experimentos en cinco conjuntos de datos de seguimientos de red ampliamente utilizados muestran que nuestros métodos superan trabajos anteriores. NetSynDM logra un rendimiento promedio un 166.1% mejor en fidelidad en comparación con las líneas base. DPNetSynDM logra un mejor equilibrio entre privacidad y fidelidad, superando las puntuaciones de fidelidad del método de síntesis de seguimientos de red de última generación anterior en un 18.4% en UGR16, mientras reduce las puntuaciones de riesgo de privacidad en aproximadamente un 9.79%.