Un marco eficiente para encontrar conjuntos de datos similares basado en ontología
Autores: Sultana, Tangina; Qudus, Umair; Umair, Muhammad; Hossain, Md. Delowar
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un marco eficiente para encontrar conjuntos de datos similares basado en ontología
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Gobiernos
Datos abiertos
Transparencia
Conjuntos de datos
Relaciones
Algoritmos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Los gobiernos están adoptando una filosofía de datos abiertos y poniendo sus datos a disposición del público de forma gratuita para fomentar la innovación y aumentar la transparencia. Sin embargo, el número de conjuntos de datos disponibles sigue siendo limitado. Encontrar relaciones entre conjuntos de datos relacionados en diferentes portales de datos permite a los usuarios buscar los conjuntos de datos relevantes. Estos conjuntos de datos se generan a partir de los datos de entrenamiento, que deben ser curados por la consulta del usuario. Sin embargo, la recuperación de conjuntos de datos relevantes es una operación costosa debido al procedimiento de preparación para cada conjunto de datos. Además, requiere una cantidad significativa de espacio y tiempo. En este estudio, proponemos un marco novedoso para identificar las relaciones entre conjuntos de datos utilizando información estructural e información semántica para encontrar conjuntos de datos similares. Proponemos un algoritmo para generar la Matriz de Conceptos (CM) y la Matriz de Conjuntos de Datos (DM) a partir de los conceptos y los conjuntos de datos, que luego se utiliza para curar conjuntos de datos semánticamente relacionados en respuesta a las consultas enviadas por los usuarios. Además, empleamos los algoritmos de compresión, indexación y almacenamiento en caché propuestos en nuestro esquema para reducir el almacenamiento y el tiempo requeridos al buscar la lista clasificada de los conjuntos de datos relacionados. A través de una evaluación exhaustiva, concluimos que el esquema propuesto supera a los esquemas existentes.
Descripción
Los gobiernos están adoptando una filosofía de datos abiertos y poniendo sus datos a disposición del público de forma gratuita para fomentar la innovación y aumentar la transparencia. Sin embargo, el número de conjuntos de datos disponibles sigue siendo limitado. Encontrar relaciones entre conjuntos de datos relacionados en diferentes portales de datos permite a los usuarios buscar los conjuntos de datos relevantes. Estos conjuntos de datos se generan a partir de los datos de entrenamiento, que deben ser curados por la consulta del usuario. Sin embargo, la recuperación de conjuntos de datos relevantes es una operación costosa debido al procedimiento de preparación para cada conjunto de datos. Además, requiere una cantidad significativa de espacio y tiempo. En este estudio, proponemos un marco novedoso para identificar las relaciones entre conjuntos de datos utilizando información estructural e información semántica para encontrar conjuntos de datos similares. Proponemos un algoritmo para generar la Matriz de Conceptos (CM) y la Matriz de Conjuntos de Datos (DM) a partir de los conceptos y los conjuntos de datos, que luego se utiliza para curar conjuntos de datos semánticamente relacionados en respuesta a las consultas enviadas por los usuarios. Además, empleamos los algoritmos de compresión, indexación y almacenamiento en caché propuestos en nuestro esquema para reducir el almacenamiento y el tiempo requeridos al buscar la lista clasificada de los conjuntos de datos relacionados. A través de una evaluación exhaustiva, concluimos que el esquema propuesto supera a los esquemas existentes.