Almacenamiento de Big Data Espacial Vectorial y Consulta Optimizada Basada en el Índice de Cuadrícula de Hilbert Multinivel en HBase
Autores: Jiang, Hua; Kang, Junfeng; Du, Zhenhong; Zhang, Feng; Huang, Xiangzhi; Liu, Renyi; Zhang, Xuanting
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Almacenamiento de Big Data Espacial Vectorial y Consulta Optimizada Basada en el Índice de Cuadrícula de Hilbert Multinivel en HBase
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Crecimiento
Datos vectoriales
Almacenamiento
Consulta
Localidad espacial
Optimización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Ante el rápido crecimiento de los datos vectoriales y la urgente necesidad de consultas de baja latencia, se ha convertido en un desafío importante y oportuno lograr de manera efectiva el almacenamiento escalable y el acceso eficiente a los grandes datos vectoriales. Sin embargo, rara vez se observa un método sistemático para el almacenamiento y consulta de datos de polígonos vectoriales que tenga en cuenta la localidad espacial en el esquema de almacenamiento, la construcción de índices y la optimización de consultas. En el artículo, nos centramos en el almacenamiento y la consulta topológica de datos de geometría de polígonos vectoriales en HBase, y la clave de fila en la tabla de HBase es la concatenación del valor de Hilbert de la celda de la cuadrícula a la que pertenece el centro del MBR de la entidad del objeto, el identificador de capa y el código de orden. Luego, se propone una nueva estructura de índice de cuadrícula de múltiples niveles, denominada Q-HBML, que incorpora la relación espacial cuadrícula-objeto y un nuevo código jerárquico de Hilbert en la cuadrícula de múltiples niveles, para mejorar la eficiencia de las consultas espaciales. Finalmente, basado en el índice Q-HBML, se presentan dos estrategias de optimización de consultas y un algoritmo de consulta topológica optimizado, ML-OTQ, para optimizar el proceso de consulta topológica y mejorar la eficiencia de la consulta topológica. A través de cuatro grupos de experimentos comparativos, se ha demostrado que nuestro enfoque soporta un mejor rendimiento.
Descripción
Ante el rápido crecimiento de los datos vectoriales y la urgente necesidad de consultas de baja latencia, se ha convertido en un desafío importante y oportuno lograr de manera efectiva el almacenamiento escalable y el acceso eficiente a los grandes datos vectoriales. Sin embargo, rara vez se observa un método sistemático para el almacenamiento y consulta de datos de polígonos vectoriales que tenga en cuenta la localidad espacial en el esquema de almacenamiento, la construcción de índices y la optimización de consultas. En el artículo, nos centramos en el almacenamiento y la consulta topológica de datos de geometría de polígonos vectoriales en HBase, y la clave de fila en la tabla de HBase es la concatenación del valor de Hilbert de la celda de la cuadrícula a la que pertenece el centro del MBR de la entidad del objeto, el identificador de capa y el código de orden. Luego, se propone una nueva estructura de índice de cuadrícula de múltiples niveles, denominada Q-HBML, que incorpora la relación espacial cuadrícula-objeto y un nuevo código jerárquico de Hilbert en la cuadrícula de múltiples niveles, para mejorar la eficiencia de las consultas espaciales. Finalmente, basado en el índice Q-HBML, se presentan dos estrategias de optimización de consultas y un algoritmo de consulta topológica optimizado, ML-OTQ, para optimizar el proceso de consulta topológica y mejorar la eficiencia de la consulta topológica. A través de cuatro grupos de experimentos comparativos, se ha demostrado que nuestro enfoque soporta un mejor rendimiento.