logo móvil
Contáctanos

Una Anonimización Unificada Basada en Clustering para la Publicación de Datos que Preservan la Privacidad con Cuantificación de Privacidad Multidimensional

Autores: Eyeleko, Anselme Herman; Feng, Tao; Yan, Yan

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Una Anonimización Unificada Basada en Clustering para la Publicación de Datos que Preservan la Privacidad con Cuantificación de Privacidad Multidimensional


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de privacidad
K-anonimato
-diversidad
Cuantificación de privacidad multidimensional
CAMDP
Cuasi-identificadores

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Como modelos de privacidad ampliamente adoptados en la publicación de datos que preservan la privacidad (PPDP), la k-anonimidad y la -diversidad han sido estudiadas extensamente por investigadores para permitir la liberación de información útil mientras se preserva la privacidad de los datos. Sin embargo, los métodos existentes sufren de varias limitaciones. A menudo dependen de modelos de privacidad unidimensionales y carecen de métricas unificadas para cuantificar con precisión las filtraciones de privacidad. Muchos enfoques pasan por alto el impacto de la similitud semántica y las creencias adversariales previas y posteriores entre atributos sensibles y emplean frecuentemente medidas de similitud subóptimas que no tienen en cuenta la naturaleza heterogénea de los cuasi-identificadores, degradando así tanto la protección de la privacidad como la utilidad de los datos. Para abordar estos desafíos, este documento propone CAMDP, un método de anonimización basado en agrupamiento unificado para la publicación de datos que preservan la privacidad con cuantificación de privacidad multidimensional. CAMDP construye clases de equivalencia que satisfacen la k-anonimidad mientras mejora simultáneamente la diversidad de atributos sensibles, reduce la similitud semántica y limita la divergencia entre las creencias adversariales previas y posteriores. Se introduce una métrica unificada multidimensional para cuantificar conjuntamente la filtración de privacidad y la pérdida de información, guiando el proceso de anonimización. Además, se emplea una métrica de distancia consciente de la similitud adaptada a cuasi-identificadores de tipo mixto para reducir la pérdida de información. Los resultados experimentales en tres conjuntos de datos de referencia, Adult, Careplans y Airline, demuestran que CAMDP supera consistentemente a los métodos de última generación. En todas las configuraciones probadas, CAMDP logra la menor filtración promedio de privacidad (0.1235, 0.0795 y 0.1855, respectivamente), una menor pérdida promedio de información (0.626, 0.636 y 0.60, respectivamente) y la menor disimilitud intra-clúster promedio (0.586, 0.635 y 0.573, respectivamente), manteniendo un tiempo de ejecución competitivo en los tres conjuntos de datos.

Otros recursos que podrían interesarte

Temas Virtualpro