Métodos anónimos basados en agrupamiento multiatributo y restricciones de generalización
Autores: Fan, Yunhui; Shi, Xiangbo; Zhang, Shuiqiang; Tong, Yala
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Métodos anónimos basados en agrupamiento multiatributo y restricciones de generalización
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Diseminación
Compartición
Aplicaciones de IoT
Privacidad
Desafíos de seguridad
K-anonimización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
La difusión y el intercambio de hojas de datos en aplicaciones de IoT presentan desafíos de privacidad y seguridad que pueden abordarse utilizando el algoritmo de k-anonimización. Sin embargo, este método necesita mejoras, por ejemplo, en áreas relacionadas con su sobregeneralización y sus insuficientes restricciones de diversidad de atributos durante el proceso de anonimización. Para abordar estos problemas, este estudio propone un método de anonimización (k, l) mediante agrupación multiatributo y restricciones de generalización que puede aplicarse a tablas de datos multidimensionales. El algoritmo primero utilizó una estrategia codiciosa para clasificar los atributos por anchura primero, derivó la división en dimensiones para construir una jerarquía de generalización multidimensional y luego seleccionó los atributos con los valores de anchura más significativos como los atributos de generalización prioritarios. A continuación, se introdujo el método de agrupación de los k-vecinos más cercanos (KNN) para determinar el centro de agrupación inicial mediante los resultados de anchura primero, dividir los atributos de cuasi-identificación en grupos KNN según una métrica de distancia y generalizar los atributos de cuasi-identificación en la clase de equivalencia utilizando una estructura de generalización jerárquica. Luego, el método propuesto reevaluó los atributos a generalizar antes de cada operación de generalización. Finalmente, el algoritmo empleó una restricción de diversidad de frecuencia mejorada para generalizar atributos sensibles con el fin de garantizar que hubiera al menos l registros mutuamente disímiles y más cercanos en la clase de equivalencia. Al limitar el umbral de frecuencia para la ocurrencia de atributos sensibles, los valores de los atributos sensibles permanecieron similares dentro del grupo, logrando así la protección del anonimato para todos los atributos.
Descripción
La difusión y el intercambio de hojas de datos en aplicaciones de IoT presentan desafíos de privacidad y seguridad que pueden abordarse utilizando el algoritmo de k-anonimización. Sin embargo, este método necesita mejoras, por ejemplo, en áreas relacionadas con su sobregeneralización y sus insuficientes restricciones de diversidad de atributos durante el proceso de anonimización. Para abordar estos problemas, este estudio propone un método de anonimización (k, l) mediante agrupación multiatributo y restricciones de generalización que puede aplicarse a tablas de datos multidimensionales. El algoritmo primero utilizó una estrategia codiciosa para clasificar los atributos por anchura primero, derivó la división en dimensiones para construir una jerarquía de generalización multidimensional y luego seleccionó los atributos con los valores de anchura más significativos como los atributos de generalización prioritarios. A continuación, se introdujo el método de agrupación de los k-vecinos más cercanos (KNN) para determinar el centro de agrupación inicial mediante los resultados de anchura primero, dividir los atributos de cuasi-identificación en grupos KNN según una métrica de distancia y generalizar los atributos de cuasi-identificación en la clase de equivalencia utilizando una estructura de generalización jerárquica. Luego, el método propuesto reevaluó los atributos a generalizar antes de cada operación de generalización. Finalmente, el algoritmo empleó una restricción de diversidad de frecuencia mejorada para generalizar atributos sensibles con el fin de garantizar que hubiera al menos l registros mutuamente disímiles y más cercanos en la clase de equivalencia. Al limitar el umbral de frecuencia para la ocurrencia de atributos sensibles, los valores de los atributos sensibles permanecieron similares dentro del grupo, logrando así la protección del anonimato para todos los atributos.