Comunicación eficiente en el aprendizaje federado vertical
Autores: Khan, Afsana; ten Thij, Marijn; Wilbik, Anna
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Comunicación eficiente en el aprendizaje federado vertical
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aprendizaje federado
Preservación de la privacidad
Aprendizaje distribuido
Sobrecarga de comunicación
Aprendizaje federado vertical
Eficiente en compresión.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
El aprendizaje federado (FL) es un enfoque de aprendizaje distribuido que preserva la privacidad y permite a múltiples partes construir conjuntamente modelos de aprendizaje automático sin revelar datos sensibles. Aunque FL ha resuelto el problema de la colaboración sin comprometer la privacidad, tiene una sobrecarga significativa de comunicación debido a la actualización repetitiva de modelos durante el entrenamiento. Varios estudios han propuesto enfoques de FL eficientes en comunicación para abordar este problema, pero aún faltan soluciones adecuadas en casos en los que las partes deben lidiar con diferentes características de datos, también conocido como aprendizaje federado vertical (VFL). En este documento, proponemos un enfoque eficiente en comunicación para VFL que comprime los datos locales de los clientes y luego agrega los datos comprimidos de todos los clientes para construir un modelo de ML. Dado que los datos locales se comparten en forma comprimida, la privacidad de estos datos se conserva. Experimentos en conjuntos de datos de referencia públicamente disponibles utilizando nuestro método propuesto muestran que el modelo final obtenido mediante la agregación de datos comprimidos de los clientes supera el rendimiento de los modelos locales de los clientes.
Descripción
El aprendizaje federado (FL) es un enfoque de aprendizaje distribuido que preserva la privacidad y permite a múltiples partes construir conjuntamente modelos de aprendizaje automático sin revelar datos sensibles. Aunque FL ha resuelto el problema de la colaboración sin comprometer la privacidad, tiene una sobrecarga significativa de comunicación debido a la actualización repetitiva de modelos durante el entrenamiento. Varios estudios han propuesto enfoques de FL eficientes en comunicación para abordar este problema, pero aún faltan soluciones adecuadas en casos en los que las partes deben lidiar con diferentes características de datos, también conocido como aprendizaje federado vertical (VFL). En este documento, proponemos un enfoque eficiente en comunicación para VFL que comprime los datos locales de los clientes y luego agrega los datos comprimidos de todos los clientes para construir un modelo de ML. Dado que los datos locales se comparten en forma comprimida, la privacidad de estos datos se conserva. Experimentos en conjuntos de datos de referencia públicamente disponibles utilizando nuestro método propuesto muestran que el modelo final obtenido mediante la agregación de datos comprimidos de los clientes supera el rendimiento de los modelos locales de los clientes.