Un marco de privacidad diferencial con compensaciones ajustables entre eficiencia y utilidad para la recopilación de datos
Autores: Kim, Jongwook; Cho, Sae-Hong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un marco de privacidad diferencial con compensaciones ajustables entre eficiencia y utilidad para la recopilación de datos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Uso generalizado
Dispositivos móviles
Datos generados por el usuario
Preocupaciones de privacidad
Privacidad diferencial
Decisiones basadas en datos.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
El uso generalizado de dispositivos móviles ha llevado a la recopilación continua de vastas cantidades de datos generados por los usuarios, respaldando decisiones basadas en datos en una variedad de campos. Sin embargo, el creciente volumen de estos datos plantea importantes preocupaciones de privacidad, especialmente cuando incluyen información personal vulnerable a un mal uso. La privacidad diferencial (DP) ha surgido como una solución destacada a estas preocupaciones, permitiendo la recopilación de datos generados por los usuarios para la toma de decisiones basadas en datos mientras se protege la privacidad del usuario. A pesar de sus fortalezas, los marcos de recopilación de datos basados en DP existentes a menudo se enfrentan a un equilibrio entre la utilidad de los datos y la sobrecarga computacional. Para abordar estos desafíos, proponemos el modelo de cobertura fraccional diferencialmente privado (DPFCM), un marco basado en DP que equilibra de forma adaptativa la utilidad de los datos y la sobrecarga computacional según los requisitos de las decisiones basadas en datos. DPFCM introduce dos parámetros, y , que controlan las fracciones de elementos de datos recopilados y datos de usuario, respectivamente, para garantizar tanto la diversidad de datos como la cobertura representativa de usuarios. Además, proponemos dos métodos basados en probabilidades para determinar de manera efectiva los datos mínimos que cada usuario debe proporcionar para satisfacer los requisitos de DPFCM. Los resultados experimentales en conjuntos de datos del mundo real validan la efectividad de DPFCM, demostrando su alta utilidad de datos y eficiencia computacional, especialmente para aplicaciones que requieren toma de decisiones en tiempo real.
Descripción
El uso generalizado de dispositivos móviles ha llevado a la recopilación continua de vastas cantidades de datos generados por los usuarios, respaldando decisiones basadas en datos en una variedad de campos. Sin embargo, el creciente volumen de estos datos plantea importantes preocupaciones de privacidad, especialmente cuando incluyen información personal vulnerable a un mal uso. La privacidad diferencial (DP) ha surgido como una solución destacada a estas preocupaciones, permitiendo la recopilación de datos generados por los usuarios para la toma de decisiones basadas en datos mientras se protege la privacidad del usuario. A pesar de sus fortalezas, los marcos de recopilación de datos basados en DP existentes a menudo se enfrentan a un equilibrio entre la utilidad de los datos y la sobrecarga computacional. Para abordar estos desafíos, proponemos el modelo de cobertura fraccional diferencialmente privado (DPFCM), un marco basado en DP que equilibra de forma adaptativa la utilidad de los datos y la sobrecarga computacional según los requisitos de las decisiones basadas en datos. DPFCM introduce dos parámetros, y , que controlan las fracciones de elementos de datos recopilados y datos de usuario, respectivamente, para garantizar tanto la diversidad de datos como la cobertura representativa de usuarios. Además, proponemos dos métodos basados en probabilidades para determinar de manera efectiva los datos mínimos que cada usuario debe proporcionar para satisfacer los requisitos de DPFCM. Los resultados experimentales en conjuntos de datos del mundo real validan la efectividad de DPFCM, demostrando su alta utilidad de datos y eficiencia computacional, especialmente para aplicaciones que requieren toma de decisiones en tiempo real.