Clasificación de tráfico de internet con aprendizaje federado
Autores: Mun, Hyunsu; Lee, Youngseok
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Clasificación de tráfico de internet con aprendizaje federado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Clasificación del tráfico de internet
Aprendizaje automático
Inspección profunda de paquetes
Aprendizaje federado
Problema de privacidad
Clasificación de paquetes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
La clasificación del tráfico de Internet es un problema típico para los proveedores de servicios de Internet o los operadores móviles, y ha habido muchos estudios basados en información estadística de encabezados de paquetes, inspección profunda de paquetes o aprendizaje automático. Debido a los avances recientes en el cifrado de extremo a extremo y las políticas de puertos dinámicos, el aprendizaje automático o profundo ha sido una clave esencial para mejorar la precisión de la clasificación de paquetes. Además, los proveedores de servicios de Internet u operadores móviles deben tratar cuidadosamente el problema de la privacidad al recopilar paquetes de usuario para contabilidad o seguridad. El reciente desarrollo del aprendizaje automático distribuido, llamado aprendizaje federado, lleva a cabo colaborativamente trabajos de aprendizaje automático en los clientes sin subir datos a un servidor central. Aunque el aprendizaje federado proporciona un marco de aprendizaje en el dispositivo hacia la protección de la privacidad del usuario, su viabilidad y rendimiento en la clasificación del tráfico de Internet no han sido completamente examinados. En este documento, proponemos un protocolo de clasificación de tráfico de aprendizaje federado (FLIC), que puede lograr una precisión comparable al aprendizaje profundo centralizado para la identificación de aplicaciones de Internet sin fugas de privacidad. FLIC puede clasificar nuevas aplicaciones sobre la marcha cuando un participante se une al aprendizaje con una nueva aplicación, lo cual no se había hecho en trabajos anteriores. Al implementar el prototipo de clientes de FLIC y un servidor con , los clientes recopilan paquetes, realizan el trabajo de entrenamiento en el dispositivo e intercambian los resultados del entrenamiento con el servidor de FLIC. Además, demostramos que la clasificación de paquetes basada en el aprendizaje federado logra una precisión del 88% bajo tráfico no independiente e idénticamente distribuido (no IID) entre los clientes. Cuando se agregó una nueva aplicación que puede clasificarse dinámicamente como cliente participante en el aprendizaje, se logró una precisión del 92%.
Descripción
La clasificación del tráfico de Internet es un problema típico para los proveedores de servicios de Internet o los operadores móviles, y ha habido muchos estudios basados en información estadística de encabezados de paquetes, inspección profunda de paquetes o aprendizaje automático. Debido a los avances recientes en el cifrado de extremo a extremo y las políticas de puertos dinámicos, el aprendizaje automático o profundo ha sido una clave esencial para mejorar la precisión de la clasificación de paquetes. Además, los proveedores de servicios de Internet u operadores móviles deben tratar cuidadosamente el problema de la privacidad al recopilar paquetes de usuario para contabilidad o seguridad. El reciente desarrollo del aprendizaje automático distribuido, llamado aprendizaje federado, lleva a cabo colaborativamente trabajos de aprendizaje automático en los clientes sin subir datos a un servidor central. Aunque el aprendizaje federado proporciona un marco de aprendizaje en el dispositivo hacia la protección de la privacidad del usuario, su viabilidad y rendimiento en la clasificación del tráfico de Internet no han sido completamente examinados. En este documento, proponemos un protocolo de clasificación de tráfico de aprendizaje federado (FLIC), que puede lograr una precisión comparable al aprendizaje profundo centralizado para la identificación de aplicaciones de Internet sin fugas de privacidad. FLIC puede clasificar nuevas aplicaciones sobre la marcha cuando un participante se une al aprendizaje con una nueva aplicación, lo cual no se había hecho en trabajos anteriores. Al implementar el prototipo de clientes de FLIC y un servidor con , los clientes recopilan paquetes, realizan el trabajo de entrenamiento en el dispositivo e intercambian los resultados del entrenamiento con el servidor de FLIC. Además, demostramos que la clasificación de paquetes basada en el aprendizaje federado logra una precisión del 88% bajo tráfico no independiente e idénticamente distribuido (no IID) entre los clientes. Cuando se agregó una nueva aplicación que puede clasificarse dinámicamente como cliente participante en el aprendizaje, se logró una precisión del 92%.