Una Anonimización Unificada Basada en Clustering para la Publicación de Datos que Preservan la Privacidad con Cuantificación de Privacidad Multidimensional
Autores: Eyeleko, Anselme Herman; Feng, Tao; Yan, Yan
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Una Anonimización Unificada Basada en Clustering para la Publicación de Datos que Preservan la Privacidad con Cuantificación de Privacidad Multidimensional
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelos de privacidad
K-anonimato
-diversidad
Cuantificación de privacidad multidimensional
CAMDP
Cuasi-identificadores
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Como modelos de privacidad ampliamente adoptados en la publicación de datos que preservan la privacidad (PPDP), la k-anonimidad y la -diversidad han sido estudiadas extensamente por investigadores para permitir la liberación de información útil mientras se preserva la privacidad de los datos. Sin embargo, los métodos existentes sufren de varias limitaciones. A menudo dependen de modelos de privacidad unidimensionales y carecen de métricas unificadas para cuantificar con precisión las filtraciones de privacidad. Muchos enfoques pasan por alto el impacto de la similitud semántica y las creencias adversariales previas y posteriores entre atributos sensibles y emplean frecuentemente medidas de similitud subóptimas que no tienen en cuenta la naturaleza heterogénea de los cuasi-identificadores, degradando así tanto la protección de la privacidad como la utilidad de los datos. Para abordar estos desafíos, este documento propone CAMDP, un método de anonimización basado en agrupamiento unificado para la publicación de datos que preservan la privacidad con cuantificación de privacidad multidimensional. CAMDP construye clases de equivalencia que satisfacen la k-anonimidad mientras mejora simultáneamente la diversidad de atributos sensibles, reduce la similitud semántica y limita la divergencia entre las creencias adversariales previas y posteriores. Se introduce una métrica unificada multidimensional para cuantificar conjuntamente la filtración de privacidad y la pérdida de información, guiando el proceso de anonimización. Además, se emplea una métrica de distancia consciente de la similitud adaptada a cuasi-identificadores de tipo mixto para reducir la pérdida de información. Los resultados experimentales en tres conjuntos de datos de referencia, Adult, Careplans y Airline, demuestran que CAMDP supera consistentemente a los métodos de última generación. En todas las configuraciones probadas, CAMDP logra la menor filtración promedio de privacidad (0.1235, 0.0795 y 0.1855, respectivamente), una menor pérdida promedio de información (0.626, 0.636 y 0.60, respectivamente) y la menor disimilitud intra-clúster promedio (0.586, 0.635 y 0.573, respectivamente), manteniendo un tiempo de ejecución competitivo en los tres conjuntos de datos.
Descripción
Como modelos de privacidad ampliamente adoptados en la publicación de datos que preservan la privacidad (PPDP), la k-anonimidad y la -diversidad han sido estudiadas extensamente por investigadores para permitir la liberación de información útil mientras se preserva la privacidad de los datos. Sin embargo, los métodos existentes sufren de varias limitaciones. A menudo dependen de modelos de privacidad unidimensionales y carecen de métricas unificadas para cuantificar con precisión las filtraciones de privacidad. Muchos enfoques pasan por alto el impacto de la similitud semántica y las creencias adversariales previas y posteriores entre atributos sensibles y emplean frecuentemente medidas de similitud subóptimas que no tienen en cuenta la naturaleza heterogénea de los cuasi-identificadores, degradando así tanto la protección de la privacidad como la utilidad de los datos. Para abordar estos desafíos, este documento propone CAMDP, un método de anonimización basado en agrupamiento unificado para la publicación de datos que preservan la privacidad con cuantificación de privacidad multidimensional. CAMDP construye clases de equivalencia que satisfacen la k-anonimidad mientras mejora simultáneamente la diversidad de atributos sensibles, reduce la similitud semántica y limita la divergencia entre las creencias adversariales previas y posteriores. Se introduce una métrica unificada multidimensional para cuantificar conjuntamente la filtración de privacidad y la pérdida de información, guiando el proceso de anonimización. Además, se emplea una métrica de distancia consciente de la similitud adaptada a cuasi-identificadores de tipo mixto para reducir la pérdida de información. Los resultados experimentales en tres conjuntos de datos de referencia, Adult, Careplans y Airline, demuestran que CAMDP supera consistentemente a los métodos de última generación. En todas las configuraciones probadas, CAMDP logra la menor filtración promedio de privacidad (0.1235, 0.0795 y 0.1855, respectivamente), una menor pérdida promedio de información (0.626, 0.636 y 0.60, respectivamente) y la menor disimilitud intra-clúster promedio (0.586, 0.635 y 0.573, respectivamente), manteniendo un tiempo de ejecución competitivo en los tres conjuntos de datos.