Ppdm-tan: un clasificador multiparte que preserva la privacidad
Autores: Skarkala, Maria Eleni; Maragoudakis, Manolis; Gritzalis, Stefanos; Mitrou, Lilian
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Ppdm-tan: un clasificador multiparte que preserva la privacidad
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Distribuido
Minería de datos
Privacidad
Criptografía
Algoritmo
Bases de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Las bases de datos médicas, financieras o sociales distribuidas se analizan diariamente en busca de patrones e información útil. Han surgido preocupaciones de privacidad, ya que algunos segmentos de bases de datos contienen datos sensibles. Las técnicas de minería de datos se utilizan para analizar, procesar y gestionar enormes cantidades de datos, asegurando la preservación de la información privada. La criptografía, como se ha demostrado en investigaciones previas, es el enfoque más preciso para adquirir conocimiento manteniendo la privacidad. En este documento, presentamos una extensión de un algoritmo de minería de datos que preserva la privacidad, diseñado y desarrollado minuciosamente para bases de datos tanto horizontal como verticalmente particionadas, que contienen valores de atributos nominales o numéricos. El algoritmo propuesto explota el esquema de elección de múltiples candidatos para construir un clasificador bayesiano ingenuo aumentado por árboles que preserva la privacidad, una variación más robusta del clasificador bayesiano ingenuo clásico. La explotación del criptosistema de Paillier y la primitiva homomórfica distintiva se muestra en el análisis de seguridad que se garantiza la privacidad y el algoritmo propuesto proporciona defensas sólidas contra ataques comunes. Los experimentos que derivan los beneficios de bases de datos del mundo real demuestran la preservación de datos privados mientras ocurren los procesos de minería y el manejo eficiente de ambos tipos de partición de bases de datos.
Descripción
Las bases de datos médicas, financieras o sociales distribuidas se analizan diariamente en busca de patrones e información útil. Han surgido preocupaciones de privacidad, ya que algunos segmentos de bases de datos contienen datos sensibles. Las técnicas de minería de datos se utilizan para analizar, procesar y gestionar enormes cantidades de datos, asegurando la preservación de la información privada. La criptografía, como se ha demostrado en investigaciones previas, es el enfoque más preciso para adquirir conocimiento manteniendo la privacidad. En este documento, presentamos una extensión de un algoritmo de minería de datos que preserva la privacidad, diseñado y desarrollado minuciosamente para bases de datos tanto horizontal como verticalmente particionadas, que contienen valores de atributos nominales o numéricos. El algoritmo propuesto explota el esquema de elección de múltiples candidatos para construir un clasificador bayesiano ingenuo aumentado por árboles que preserva la privacidad, una variación más robusta del clasificador bayesiano ingenuo clásico. La explotación del criptosistema de Paillier y la primitiva homomórfica distintiva se muestra en el análisis de seguridad que se garantiza la privacidad y el algoritmo propuesto proporciona defensas sólidas contra ataques comunes. Los experimentos que derivan los beneficios de bases de datos del mundo real demuestran la preservación de datos privados mientras ocurren los procesos de minería y el manejo eficiente de ambos tipos de partición de bases de datos.