logo móvil
Contáctanos

Un marco eficiente para encontrar conjuntos de datos similares basado en ontología

Autores: Sultana, Tangina; Qudus, Umair; Umair, Muhammad; Hossain, Md. Delowar

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Un marco eficiente para encontrar conjuntos de datos similares basado en ontología


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Gobiernos
Datos abiertos
Transparencia
Conjuntos de datos
Relaciones
Algoritmos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
Los gobiernos están adoptando una filosofía de datos abiertos y poniendo sus datos a disposición del público de forma gratuita para fomentar la innovación y aumentar la transparencia. Sin embargo, el número de conjuntos de datos disponibles sigue siendo limitado. Encontrar relaciones entre conjuntos de datos relacionados en diferentes portales de datos permite a los usuarios buscar los conjuntos de datos relevantes. Estos conjuntos de datos se generan a partir de los datos de entrenamiento, que deben ser curados por la consulta del usuario. Sin embargo, la recuperación de conjuntos de datos relevantes es una operación costosa debido al procedimiento de preparación para cada conjunto de datos. Además, requiere una cantidad significativa de espacio y tiempo. En este estudio, proponemos un marco novedoso para identificar las relaciones entre conjuntos de datos utilizando información estructural e información semántica para encontrar conjuntos de datos similares. Proponemos un algoritmo para generar la Matriz de Conceptos (CM) y la Matriz de Conjuntos de Datos (DM) a partir de los conceptos y los conjuntos de datos, que luego se utiliza para curar conjuntos de datos semánticamente relacionados en respuesta a las consultas enviadas por los usuarios. Además, empleamos los algoritmos de compresión, indexación y almacenamiento en caché propuestos en nuestro esquema para reducir el almacenamiento y el tiempo requeridos al buscar la lista clasificada de los conjuntos de datos relacionados. A través de una evaluación exhaustiva, concluimos que el esquema propuesto supera a los esquemas existentes.

Otros recursos que podrían interesarte

Temas Virtualpro