Glmi: un índice espaciotemporal eficiente que aprovecha geohash y modelos lineales a trozos para un rendimiento de consulta optimizado
Autores: Chen, Kun; Liu, Gang; Chen, Genshen; Weng, Zhengping; Chen, Qiyu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Glmi: un índice espaciotemporal eficiente que aprovecha geohash y modelos lineales a trozos para un rendimiento de consulta optimizado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Espaciotemporal
Datos
índice
GLMI
Espacio
Tiempo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Los grandes datos espaciotemporales contienen información en múltiples dimensiones como el espacio y el tiempo. Los datos espaciotemporales tienen las características de un gran volumen, relaciones espaciotemporales intrincadas y una distribución espaciotemporal desigual. La estructura de índice es una de las tecnologías más importantes utilizadas para mejorar el análisis de datos del sistema y la carga de trabajo. Sin embargo, es difícil ajustarse dinámicamente a la densidad de datos, lo que resulta en un aumento de los costos de mantenimiento y la complejidad de recuperación. Al mismo tiempo, mantener la proximidad de los datos espaciotemporales en dimensiones espaciales o temporales es crucial para un análisis espaciotemporal eficiente. Para abordar estos desafíos, este documento propone un método de índice aprendido, GLMI (índice basado en Geohash y modelo lineal por tramos para datos espaciotemporales). GLMI utiliza la partición dinámica del espacio basada en la curva de Hilbert para reducir el impacto de la desviación de datos en el rendimiento del índice. En la dimensión del tiempo, se construyó un modelo lineal por tramos utilizando el algoritmo ShrinkingCone, y se diseñó un búfer para admitir la escritura rápida de datos espaciotemporales. En comparación con los índices tradicionales de alta dimensión y el índice ZM de corriente principal actual, GLMI tiene un menor consumo de espacio y un tiempo de construcción más corto en comparación con los índices aprendidos de alta dimensión en conjuntos de datos reales de itinerarios de tráfico y registros de trayectorias. Mientras tanto, GLMI también tiene una ventaja en la eficiencia de consulta.
Descripción
Los grandes datos espaciotemporales contienen información en múltiples dimensiones como el espacio y el tiempo. Los datos espaciotemporales tienen las características de un gran volumen, relaciones espaciotemporales intrincadas y una distribución espaciotemporal desigual. La estructura de índice es una de las tecnologías más importantes utilizadas para mejorar el análisis de datos del sistema y la carga de trabajo. Sin embargo, es difícil ajustarse dinámicamente a la densidad de datos, lo que resulta en un aumento de los costos de mantenimiento y la complejidad de recuperación. Al mismo tiempo, mantener la proximidad de los datos espaciotemporales en dimensiones espaciales o temporales es crucial para un análisis espaciotemporal eficiente. Para abordar estos desafíos, este documento propone un método de índice aprendido, GLMI (índice basado en Geohash y modelo lineal por tramos para datos espaciotemporales). GLMI utiliza la partición dinámica del espacio basada en la curva de Hilbert para reducir el impacto de la desviación de datos en el rendimiento del índice. En la dimensión del tiempo, se construyó un modelo lineal por tramos utilizando el algoritmo ShrinkingCone, y se diseñó un búfer para admitir la escritura rápida de datos espaciotemporales. En comparación con los índices tradicionales de alta dimensión y el índice ZM de corriente principal actual, GLMI tiene un menor consumo de espacio y un tiempo de construcción más corto en comparación con los índices aprendidos de alta dimensión en conjuntos de datos reales de itinerarios de tráfico y registros de trayectorias. Mientras tanto, GLMI también tiene una ventaja en la eficiencia de consulta.