DFTHR: Un marco distribuido para consultas de similitud de trayectorias basado en HBase y Redis
Autores: Qin, Jiwei; Ma, Liangli; Liu, Qing
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
DFTHR: Un marco distribuido para consultas de similitud de trayectorias basado en HBase y Redis
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Sensores
Datos de trayectoria
Consulta de similitud
Marco distribuido
DFTHR
Distancia de Hausdorff
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En los últimos años, los sensores de posicionamiento se han vuelto omnipresentes y ha habido un crecimiento tremendo en la cantidad de datos de trayectorias. Es un gran desafío almacenar y consultar de manera eficiente datos masivos de trayectorias. Entre las operaciones típicas sobre trayectorias, la consulta de similitud es un operador importante pero complicado. Es útil en sistemas de navegación, optimizaciones de transporte, y así sucesivamente. Sin embargo, la mayoría de los estudios existentes se han centrado en abordar el problema en un sistema centralizado, mientras que con una sola máquina es difícil satisfacer los requisitos de almacenamiento y procesamiento de datos masivos. Se necesita urgentemente un marco distribuido para la consulta de similitud de datos masivos de trayectorias. En esta investigación, proponemos DFTHR (marco distribuido basado en HBase y Redis) para soportar la consulta de similitud utilizando la distancia de Hausdorff. DFTHR utiliza un modelo de datos basado en segmentos con una serie de optimizaciones para almacenar, indexar y podar, para garantizar una capacidad de consulta eficiente. Además, adopta un método basado en lotes para aliviar el costo de ajustar particiones, de modo que el conjunto de datos incremental pueda ser soportado de manera eficiente. Adicionalmente, DFTHR introduce una estrategia distribuida basada en co-localización y un algoritmo de consulta paralelo basado en localidad de nodo para reducir el costo de sobrecarga entre trabajadores. Los experimentos muestran que DFTHR supera significativamente a otros esquemas.
Descripción
En los últimos años, los sensores de posicionamiento se han vuelto omnipresentes y ha habido un crecimiento tremendo en la cantidad de datos de trayectorias. Es un gran desafío almacenar y consultar de manera eficiente datos masivos de trayectorias. Entre las operaciones típicas sobre trayectorias, la consulta de similitud es un operador importante pero complicado. Es útil en sistemas de navegación, optimizaciones de transporte, y así sucesivamente. Sin embargo, la mayoría de los estudios existentes se han centrado en abordar el problema en un sistema centralizado, mientras que con una sola máquina es difícil satisfacer los requisitos de almacenamiento y procesamiento de datos masivos. Se necesita urgentemente un marco distribuido para la consulta de similitud de datos masivos de trayectorias. En esta investigación, proponemos DFTHR (marco distribuido basado en HBase y Redis) para soportar la consulta de similitud utilizando la distancia de Hausdorff. DFTHR utiliza un modelo de datos basado en segmentos con una serie de optimizaciones para almacenar, indexar y podar, para garantizar una capacidad de consulta eficiente. Además, adopta un método basado en lotes para aliviar el costo de ajustar particiones, de modo que el conjunto de datos incremental pueda ser soportado de manera eficiente. Adicionalmente, DFTHR introduce una estrategia distribuida basada en co-localización y un algoritmo de consulta paralelo basado en localidad de nodo para reducir el costo de sobrecarga entre trabajadores. Los experimentos muestran que DFTHR supera significativamente a otros esquemas.