Autenticando los resultados de búsqueda de similitud basada en -gramos para bases de datos de cadenas subcontratadas
Autores: Yang, Liangyong; Ye, Haizhou; Liu, Xuyang; Mao, Yijun; Zhang, Jilian
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Autenticando los resultados de búsqueda de similitud basada en -gramos para bases de datos de cadenas subcontratadas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Búsquedas de cadenas aproximadas
Estructura de índice autenticado
árbol de hash de Merkle
índice invertido de -gram
Algoritmo eficiente
Método de optimización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Las búsquedas de cadenas aproximadas se han aplicado ampliamente en muchos campos, como la bioinformática, la recuperación de textos, los motores de búsqueda y los servicios basados en la ubicación (LBS). Sin embargo, los resultados de búsqueda de cadenas aproximadas de servidores de terceros pueden ser incorrectos debido a la posibilidad de terceros malintencionados o servidores comprometidos. En este documento, diseñamos una estructura de índice autenticada (AIS) para bases de datos de cadenas, que se basa en el método del árbol de hash de Merkle (MHT) y el índice invertido de -gramos. Nuestro AIS puede facilitar la construcción de objetos de verificación para búsquedas de cadenas aproximadas con umbrales de distancia de edición. Diseñamos un algoritmo eficiente llamado para la construcción en el lado del servidor y la verificación de resultados de búsqueda en el lado del usuario. También presentamos un método de optimización llamado - que puede reducir el tamaño drásticamente. Finalmente, realizamos experimentos extensos en conjuntos de datos reales para demostrar que nuestros métodos propuestos son eficientes y prometedores.
Descripción
Las búsquedas de cadenas aproximadas se han aplicado ampliamente en muchos campos, como la bioinformática, la recuperación de textos, los motores de búsqueda y los servicios basados en la ubicación (LBS). Sin embargo, los resultados de búsqueda de cadenas aproximadas de servidores de terceros pueden ser incorrectos debido a la posibilidad de terceros malintencionados o servidores comprometidos. En este documento, diseñamos una estructura de índice autenticada (AIS) para bases de datos de cadenas, que se basa en el método del árbol de hash de Merkle (MHT) y el índice invertido de -gramos. Nuestro AIS puede facilitar la construcción de objetos de verificación para búsquedas de cadenas aproximadas con umbrales de distancia de edición. Diseñamos un algoritmo eficiente llamado para la construcción en el lado del servidor y la verificación de resultados de búsqueda en el lado del usuario. También presentamos un método de optimización llamado - que puede reducir el tamaño drásticamente. Finalmente, realizamos experimentos extensos en conjuntos de datos reales para demostrar que nuestros métodos propuestos son eficientes y prometedores.