Actor diferencialmente privado y su traza de elegibilidad
Autores: Seo, Kanghyeon; Yang, Jihoon
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Actor diferencialmente privado y su traza de elegibilidad
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Actor
Traza de elegibilidad
Privacidad diferencial
Crítico
Algoritmo de gradiente de política
Anonimato
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Presentamos un actor diferencialmente privado y su huella de elegibilidad en un enfoque actor-crítico, en el cual un actor toma acciones interactuando directamente con un entorno; sin embargo, el crítico estima solo los valores de estado que se obtienen a través de bootstrapping. En otras palabras, el actor refleja la información más detallada sobre la secuencia de acciones tomadas en su parámetro que el crítico. Además, sus huellas de elegibilidad correspondientes tienen las mismas propiedades. Por lo tanto, es necesario preservar la privacidad de un actor y su huella de elegibilidad mientras se entrena con datos privados o sensibles. En este documento, confirmamos la aplicabilidad de los métodos de privacidad diferencial a los actores actualizados utilizando el algoritmo de gradiente de política y discutimos las ventajas de dicho enfoque con respecto al aprendizaje crítico diferencialmente privado. Además, medimos la similitud del coseno entre la huella de elegibilidad aplicada diferencialmente privada y la huella de elegibilidad no diferencialmente privada para analizar si su anonimato está adecuadamente protegido en el actor diferencialmente privado o en el crítico. Realizamos experimentos considerando dos ejemplos sintéticos que imitan problemas del mundo real en los dominios médico y de navegación autónoma, y los resultados confirmaron la viabilidad del método propuesto.
Descripción
Presentamos un actor diferencialmente privado y su huella de elegibilidad en un enfoque actor-crítico, en el cual un actor toma acciones interactuando directamente con un entorno; sin embargo, el crítico estima solo los valores de estado que se obtienen a través de bootstrapping. En otras palabras, el actor refleja la información más detallada sobre la secuencia de acciones tomadas en su parámetro que el crítico. Además, sus huellas de elegibilidad correspondientes tienen las mismas propiedades. Por lo tanto, es necesario preservar la privacidad de un actor y su huella de elegibilidad mientras se entrena con datos privados o sensibles. En este documento, confirmamos la aplicabilidad de los métodos de privacidad diferencial a los actores actualizados utilizando el algoritmo de gradiente de política y discutimos las ventajas de dicho enfoque con respecto al aprendizaje crítico diferencialmente privado. Además, medimos la similitud del coseno entre la huella de elegibilidad aplicada diferencialmente privada y la huella de elegibilidad no diferencialmente privada para analizar si su anonimato está adecuadamente protegido en el actor diferencialmente privado o en el crítico. Realizamos experimentos considerando dos ejemplos sintéticos que imitan problemas del mundo real en los dominios médico y de navegación autónoma, y los resultados confirmaron la viabilidad del método propuesto.