logo móvil
Contáctanos

Agrupación de trayectorias y -NN para un procesamiento de consultas -NN robusto y preservador de la privacidad en GeoSpark

Autores: Dritsas, Elias; Kanavos, Andreas; Trigka, Maria; Vonitsanos, Gerasimos; Sioutas, Spyros; Tsakalidis, Athanasios

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Agrupación de trayectorias y -NN para un procesamiento de consultas -NN robusto y preservador de la privacidad en GeoSpark


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Privacidad
Anonimato
Modelado de datos
GeoSpark
Datos espacio-temporales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 39

Citaciones: Sin citaciones


Descripción
La preservación de la privacidad y el anonimato han suscitado una preocupación significativa desde la perspectiva de los grandes datos. Tenemos la visión de que los marcos y teorías futuros establecerán varias soluciones para la protección de la privacidad. El -anonimato se considera una solución clave que se ha empleado ampliamente para evitar la reidentificación de datos y nos preocupa en el contexto de este trabajo. El modelado de datos también ha ganado una atención significativa desde la perspectiva de los grandes datos. Se cree que los entornos distribuidos en evolución proporcionarán a los usuarios varias soluciones para la gestión eficiente de datos espacio-temporales. GeoSpark se utilizará en el trabajo actual ya que es una solución clave que se ha empleado ampliamente para datos espaciales. Específicamente, funciona sobre Apache Spark, el marco principal aprovechado por la comunidad de investigación y organizaciones para la transformación, procesamiento y visualización de grandes datos. Con este fin, nos centramos en la representación de datos de trayectoria para que sea aplicable al entorno de GeoSpark, y se diseña un enfoque basado en GeoSpark para la gestión eficiente de datos espacio-temporales reales. El siguiente paso es obtener una comprensión más profunda de los datos a través de la aplicación de consultas de vecinos más cercanos (-NN) ya sea utilizando métodos de indexación u otros. El cálculo del conjunto de -anonimato, que es el componente principal para la evaluación de la preservación de la privacidad y el principal problema de nuestros trabajos anteriores, se evalúa en el entorno de GeoSpark. Más concretamente, el enfoque aquí se centra en el costo temporal del cálculo del conjunto de -anonimato junto con la medición de la vulnerabilidad. Los resultados extraídos se presentan en tablas y figuras para su inspección visual.

Otros recursos que podrían interesarte

Temas Virtualpro