Jqpro: unión de consultas en un sistema distribuido para grandes datos rdf utilizando la técnica de unión de hash-merge
Autores: Elzein, Nahla Mohammed; Majid, Mazlina Abdul; Hashem, Ibrahim Abaker Targio; Ibrahim, Ashraf Osman; Abulfaraj, Anas W.; Binzagr, Faisal
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Jqpro: unión de consultas en un sistema distribuido para grandes datos rdf utilizando la técnica de unión de hash-merge
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos semánticos
Conjuntos de datos RDF
Consultas
Modelo JQPro
Marco de trabajo MapReduce
Rendimiento.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
En la última década, el volumen de datos semánticos ha aumentado exponencialmente, con el número de conjuntos de datos de Framework de Descripción de Recursos (RDF) superando los billones de triples en repositorios RDF. Por lo tanto, el tamaño de los conjuntos de datos RDF sigue creciendo. Sin embargo, con el creciente número de triples RDF, las consultas RDF múltiples y complejas están convirtiéndose en una demanda significativa. A veces, dichas consultas complejas producen muchas subexpresiones comunes en una sola consulta o en múltiples consultas que se ejecutan en lotes. Además, también es difícil minimizar el número de consultas RDF y el tiempo de procesamiento para una gran cantidad de datos relacionados en un entorno distribuido típico. Para abordar esta complicación, presentamos un modelo de procesamiento de consultas de unión para datos RDF grandes, llamado JQPro. Al adoptar un marco MapReduce en JQPro, desarrollamos tres nuevos algoritmos, que son hash-join, sort-merge y MapReduce-join mejorado para el procesamiento de consultas de unión de datos RDF. Según un experimento realizado, el resultado mostró que el modelo JQPro superó a los dos algoritmos populares, gStore y RDF-3X, en cuanto al tiempo de ejecución promedio. Además, el modelo JQPro también se probó contra RDF-3X, RDFox y PARJs utilizando el benchmark LUBM. El resultado mostró que el modelo JQPro tuvo un mejor rendimiento en comparación con los otros modelos. En conclusión, los hallazgos mostraron que JQPro logró un rendimiento mejorado con un 87.77% en términos de tiempo de ejecución. Por lo tanto, en comparación con los modelos seleccionados, JQPro tiene un mejor rendimiento.
Descripción
En la última década, el volumen de datos semánticos ha aumentado exponencialmente, con el número de conjuntos de datos de Framework de Descripción de Recursos (RDF) superando los billones de triples en repositorios RDF. Por lo tanto, el tamaño de los conjuntos de datos RDF sigue creciendo. Sin embargo, con el creciente número de triples RDF, las consultas RDF múltiples y complejas están convirtiéndose en una demanda significativa. A veces, dichas consultas complejas producen muchas subexpresiones comunes en una sola consulta o en múltiples consultas que se ejecutan en lotes. Además, también es difícil minimizar el número de consultas RDF y el tiempo de procesamiento para una gran cantidad de datos relacionados en un entorno distribuido típico. Para abordar esta complicación, presentamos un modelo de procesamiento de consultas de unión para datos RDF grandes, llamado JQPro. Al adoptar un marco MapReduce en JQPro, desarrollamos tres nuevos algoritmos, que son hash-join, sort-merge y MapReduce-join mejorado para el procesamiento de consultas de unión de datos RDF. Según un experimento realizado, el resultado mostró que el modelo JQPro superó a los dos algoritmos populares, gStore y RDF-3X, en cuanto al tiempo de ejecución promedio. Además, el modelo JQPro también se probó contra RDF-3X, RDFox y PARJs utilizando el benchmark LUBM. El resultado mostró que el modelo JQPro tuvo un mejor rendimiento en comparación con los otros modelos. En conclusión, los hallazgos mostraron que JQPro logró un rendimiento mejorado con un 87.77% en términos de tiempo de ejecución. Por lo tanto, en comparación con los modelos seleccionados, JQPro tiene un mejor rendimiento.