Aprendizaje federado con intercambio dinámico de modelos
Autores: Hilberger, Hannes; Hanke, Sten; Bödenler, Markus
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aprendizaje federado con intercambio dinámico de modelos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Grandes cantidades
Modelos de aprendizaje automático
Datos del mundo real
Aprendizaje federado
Marcos de trabajo
Configuración de entrenamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Grandes cantidades de datos son necesarias para entrenar modelos de aprendizaje automático robustos y precisos, pero la adquisición de estos datos es complicada debido a regulaciones estrictas. Mientras que muchos sectores empresariales a menudo tienen silos de datos no utilizados, los investigadores se enfrentan al problema de no poder obtener una gran cantidad de datos del mundo real. Esto es especialmente cierto en el sector de la salud, ya que la transferencia de estos datos está a menudo asociada con una sobrecarga burocrática debido, por ejemplo, a los requisitos de seguridad aumentados y las leyes de privacidad. El Aprendizaje Federado debería sortear este problema y permitir que el entrenamiento se realice directamente en el lado del propietario de los datos sin enviarlos a un lugar central como un servidor. Actualmente existen varios marcos para este propósito, como TensorFlow Federated, Flower o PySyft/PyGrid. Estos marcos definen modelos tanto para el servidor como para el cliente, ya que la coordinación del entrenamiento la realiza un servidor. Aquí presentamos un método práctico que contiene un intercambio dinámico del modelo, de modo que el modelo no se almacena estáticamente en el código fuente. Durante este proceso, la arquitectura del modelo y la configuración de entrenamiento son definidas por los investigadores y enviadas al servidor, que pasa los ajustes a los clientes. Además, el propietario de los datos transforma el modelo para incorporar la Privacidad Diferencial. Para trazar una comparación entre el aprendizaje central y el impacto de la Privacidad Diferencial, se realizaron experimentos de evaluación de rendimiento y seguridad. Se encontró que el Aprendizaje Federado puede lograr resultados similares al aprendizaje centralizado y que el uso de la Privacidad Diferencial puede mejorar la robustez del modelo contra Ataques de Inferencia de Membresía en un entorno honesto pero curioso.
Descripción
Grandes cantidades de datos son necesarias para entrenar modelos de aprendizaje automático robustos y precisos, pero la adquisición de estos datos es complicada debido a regulaciones estrictas. Mientras que muchos sectores empresariales a menudo tienen silos de datos no utilizados, los investigadores se enfrentan al problema de no poder obtener una gran cantidad de datos del mundo real. Esto es especialmente cierto en el sector de la salud, ya que la transferencia de estos datos está a menudo asociada con una sobrecarga burocrática debido, por ejemplo, a los requisitos de seguridad aumentados y las leyes de privacidad. El Aprendizaje Federado debería sortear este problema y permitir que el entrenamiento se realice directamente en el lado del propietario de los datos sin enviarlos a un lugar central como un servidor. Actualmente existen varios marcos para este propósito, como TensorFlow Federated, Flower o PySyft/PyGrid. Estos marcos definen modelos tanto para el servidor como para el cliente, ya que la coordinación del entrenamiento la realiza un servidor. Aquí presentamos un método práctico que contiene un intercambio dinámico del modelo, de modo que el modelo no se almacena estáticamente en el código fuente. Durante este proceso, la arquitectura del modelo y la configuración de entrenamiento son definidas por los investigadores y enviadas al servidor, que pasa los ajustes a los clientes. Además, el propietario de los datos transforma el modelo para incorporar la Privacidad Diferencial. Para trazar una comparación entre el aprendizaje central y el impacto de la Privacidad Diferencial, se realizaron experimentos de evaluación de rendimiento y seguridad. Se encontró que el Aprendizaje Federado puede lograr resultados similares al aprendizaje centralizado y que el uso de la Privacidad Diferencial puede mejorar la robustez del modelo contra Ataques de Inferencia de Membresía en un entorno honesto pero curioso.