Epa-Gan: anonimización de energía eléctrica a través del modelo de red generativa adversarial
Autores: Yang, Yixin; Shen, Wen; Guo, Qian; Shan, Qiuhong; Cai, Yihan; Song, Yubo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Epa-Gan: anonimización de energía eléctrica a través del modelo de red generativa adversarial
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Marketing de electricidad
Utilización de datos
Modelo de anonimización
Redes generativas adversarias
Codificadores de características
Protección de la privacidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
El paisaje contemporáneo de la utilización de datos en el marketing de electricidad se caracteriza por una mayor apertura, una circulación de datos más intensa y contextos de interacción más intrincados. Durante todo el ciclo de vida de los datos, la amenaza persistente de fuga está siempre presente. En este estudio, presentamos un novedoso modelo de anonimización de datos de electricidad, denominado EPA-GAN, que se basa en la generación de tablas. En comparación con las metodologías existentes, nuestro modelo amplía los fundamentos de las redes generativas adversariales al incorporar codificadores de características y mecanismos de retroalimentación. Esta adaptación permite la generación de datos anonimizados con una mayor practicidad y similitud a los datos originales, específicamente diseñados para tipos de datos mixtos, logrando así un desacoplamiento deliberado de los datos fuente. Nuestro enfoque propuesto comienza analizando el archivo JSON original, codificándolo en función de los tipos de variables y características utilizando codificadores de características distintos. Posteriormente, se emplea una red generativa adversarial, mejorada con información, pérdidas de generador aguas abajo y la modificación Was + GP, para generar datos anonimizados. La introducción de ruido aleatorio fortalece la protección de la privacidad durante el proceso de generación de datos. La validación experimental atestigua una reducción notable tanto en la utilidad del aprendizaje automático como en la disimilitud estadística entre los datos sintetizados por nuestro modelo de anonimización propuesto y el conjunto de datos original. Esto respalda la eficacia del modelo para reemplazar los datos originales en el análisis de minería y el intercambio de datos, salvaguardando así efectivamente la privacidad de los datos fuente.
Descripción
El paisaje contemporáneo de la utilización de datos en el marketing de electricidad se caracteriza por una mayor apertura, una circulación de datos más intensa y contextos de interacción más intrincados. Durante todo el ciclo de vida de los datos, la amenaza persistente de fuga está siempre presente. En este estudio, presentamos un novedoso modelo de anonimización de datos de electricidad, denominado EPA-GAN, que se basa en la generación de tablas. En comparación con las metodologías existentes, nuestro modelo amplía los fundamentos de las redes generativas adversariales al incorporar codificadores de características y mecanismos de retroalimentación. Esta adaptación permite la generación de datos anonimizados con una mayor practicidad y similitud a los datos originales, específicamente diseñados para tipos de datos mixtos, logrando así un desacoplamiento deliberado de los datos fuente. Nuestro enfoque propuesto comienza analizando el archivo JSON original, codificándolo en función de los tipos de variables y características utilizando codificadores de características distintos. Posteriormente, se emplea una red generativa adversarial, mejorada con información, pérdidas de generador aguas abajo y la modificación Was + GP, para generar datos anonimizados. La introducción de ruido aleatorio fortalece la protección de la privacidad durante el proceso de generación de datos. La validación experimental atestigua una reducción notable tanto en la utilidad del aprendizaje automático como en la disimilitud estadística entre los datos sintetizados por nuestro modelo de anonimización propuesto y el conjunto de datos original. Esto respalda la eficacia del modelo para reemplazar los datos originales en el análisis de minería y el intercambio de datos, salvaguardando así efectivamente la privacidad de los datos fuente.