Privacidad-preservando aprendizaje profundo distribuido a través de reencriptación homomórfica
Autores: Tang, Fengyi; Wu, Wei; Liu, Jian; Wang, Huimei; Xian, Ming
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Privacidad-preservando aprendizaje profundo distribuido a través de reencriptación homomórfica
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Conjuntos de datos de entrenamiento distribuidos
Privacidad de datos
Preservación de la privacidad
Coludir
Canal seguro
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
El floreciente aprendizaje profundo en conjuntos de datos de entrenamiento distribuidos suscita preocupaciones sobre la privacidad de los datos. El trabajo reciente relacionado con el aprendizaje profundo distribuido preservando la privacidad se basa en la suposición de que el servidor y cualquier participante en el aprendizaje no coludan. Una vez que coluden, el servidor podría descifrar y obtener los datos de todos los participantes en el aprendizaje. Además, dado que las claves privadas de todos los participantes en el aprendizaje son las mismas, un participante en el aprendizaje debe conectarse al servidor a través de un canal seguro TLS/SSL distinto para evitar filtrar datos a otros participantes en el aprendizaje. Para solucionar estos problemas, proponemos un esquema de aprendizaje profundo distribuido preservando la privacidad con las siguientes mejoras: (1) ninguna información se filtra al servidor incluso si algún participante en el aprendizaje colude con el servidor; (2) los participantes en el aprendizaje no necesitan canales seguros diferentes para comunicarse con el servidor; y (3) la precisión del modelo de aprendizaje profundo es mayor. Logramos esto introduciendo un servidor de transformación de claves y utilizando reencriptación homomórfica en el descenso de gradiente estocástico asíncrono aplicado al aprendizaje profundo. Mostramos que nuestro esquema agrega un costo de comunicación tolerable al sistema de aprendizaje profundo, pero logra más propiedades de seguridad. El costo computacional de los participantes en el aprendizaje es similar. En general, nuestro esquema es un esquema de aprendizaje profundo más seguro y preciso para los participantes en el aprendizaje distribuido.
Descripción
El floreciente aprendizaje profundo en conjuntos de datos de entrenamiento distribuidos suscita preocupaciones sobre la privacidad de los datos. El trabajo reciente relacionado con el aprendizaje profundo distribuido preservando la privacidad se basa en la suposición de que el servidor y cualquier participante en el aprendizaje no coludan. Una vez que coluden, el servidor podría descifrar y obtener los datos de todos los participantes en el aprendizaje. Además, dado que las claves privadas de todos los participantes en el aprendizaje son las mismas, un participante en el aprendizaje debe conectarse al servidor a través de un canal seguro TLS/SSL distinto para evitar filtrar datos a otros participantes en el aprendizaje. Para solucionar estos problemas, proponemos un esquema de aprendizaje profundo distribuido preservando la privacidad con las siguientes mejoras: (1) ninguna información se filtra al servidor incluso si algún participante en el aprendizaje colude con el servidor; (2) los participantes en el aprendizaje no necesitan canales seguros diferentes para comunicarse con el servidor; y (3) la precisión del modelo de aprendizaje profundo es mayor. Logramos esto introduciendo un servidor de transformación de claves y utilizando reencriptación homomórfica en el descenso de gradiente estocástico asíncrono aplicado al aprendizaje profundo. Mostramos que nuestro esquema agrega un costo de comunicación tolerable al sistema de aprendizaje profundo, pero logra más propiedades de seguridad. El costo computacional de los participantes en el aprendizaje es similar. En general, nuestro esquema es un esquema de aprendizaje profundo más seguro y preciso para los participantes en el aprendizaje distribuido.