Agrupación de trayectorias y -NN para un procesamiento de consultas -NN robusto y preservador de la privacidad en GeoSpark
Autores: Dritsas, Elias; Kanavos, Andreas; Trigka, Maria; Vonitsanos, Gerasimos; Sioutas, Spyros; Tsakalidis, Athanasios
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Agrupación de trayectorias y -NN para un procesamiento de consultas -NN robusto y preservador de la privacidad en GeoSpark
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Privacidad
Anonimato
Modelado de datos
GeoSpark
Datos espacio-temporales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
La preservación de la privacidad y el anonimato han suscitado una preocupación significativa desde la perspectiva de los grandes datos. Tenemos la visión de que los marcos y teorías futuros establecerán varias soluciones para la protección de la privacidad. El -anonimato se considera una solución clave que se ha empleado ampliamente para evitar la reidentificación de datos y nos preocupa en el contexto de este trabajo. El modelado de datos también ha ganado una atención significativa desde la perspectiva de los grandes datos. Se cree que los entornos distribuidos en evolución proporcionarán a los usuarios varias soluciones para la gestión eficiente de datos espacio-temporales. GeoSpark se utilizará en el trabajo actual ya que es una solución clave que se ha empleado ampliamente para datos espaciales. Específicamente, funciona sobre Apache Spark, el marco principal aprovechado por la comunidad de investigación y organizaciones para la transformación, procesamiento y visualización de grandes datos. Con este fin, nos centramos en la representación de datos de trayectoria para que sea aplicable al entorno de GeoSpark, y se diseña un enfoque basado en GeoSpark para la gestión eficiente de datos espacio-temporales reales. El siguiente paso es obtener una comprensión más profunda de los datos a través de la aplicación de consultas de vecinos más cercanos (-NN) ya sea utilizando métodos de indexación u otros. El cálculo del conjunto de -anonimato, que es el componente principal para la evaluación de la preservación de la privacidad y el principal problema de nuestros trabajos anteriores, se evalúa en el entorno de GeoSpark. Más concretamente, el enfoque aquí se centra en el costo temporal del cálculo del conjunto de -anonimato junto con la medición de la vulnerabilidad. Los resultados extraídos se presentan en tablas y figuras para su inspección visual.
Descripción
La preservación de la privacidad y el anonimato han suscitado una preocupación significativa desde la perspectiva de los grandes datos. Tenemos la visión de que los marcos y teorías futuros establecerán varias soluciones para la protección de la privacidad. El -anonimato se considera una solución clave que se ha empleado ampliamente para evitar la reidentificación de datos y nos preocupa en el contexto de este trabajo. El modelado de datos también ha ganado una atención significativa desde la perspectiva de los grandes datos. Se cree que los entornos distribuidos en evolución proporcionarán a los usuarios varias soluciones para la gestión eficiente de datos espacio-temporales. GeoSpark se utilizará en el trabajo actual ya que es una solución clave que se ha empleado ampliamente para datos espaciales. Específicamente, funciona sobre Apache Spark, el marco principal aprovechado por la comunidad de investigación y organizaciones para la transformación, procesamiento y visualización de grandes datos. Con este fin, nos centramos en la representación de datos de trayectoria para que sea aplicable al entorno de GeoSpark, y se diseña un enfoque basado en GeoSpark para la gestión eficiente de datos espacio-temporales reales. El siguiente paso es obtener una comprensión más profunda de los datos a través de la aplicación de consultas de vecinos más cercanos (-NN) ya sea utilizando métodos de indexación u otros. El cálculo del conjunto de -anonimato, que es el componente principal para la evaluación de la preservación de la privacidad y el principal problema de nuestros trabajos anteriores, se evalúa en el entorno de GeoSpark. Más concretamente, el enfoque aquí se centra en el costo temporal del cálculo del conjunto de -anonimato junto con la medición de la vulnerabilidad. Los resultados extraídos se presentan en tablas y figuras para su inspección visual.