Hacia una búsqueda de similitud eficiente bajo la distancia de edición en arquitecturas híbridas

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Hacia una búsqueda de similitud eficiente bajo la distancia de edición en arquitecturas híbridas

Autores: Khalid, Madiha; Yousaf, Muhammad Murtaza; Sadiq, Muhammad Umair

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Hacia una búsqueda de similitud eficiente bajo la distancia de edición en arquitecturas híbridas

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Distancia de edición

Búsqueda de similitud

Secuencias

Programación dinámica

Algoritmos paralelos

Escalabilidad

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

La distancia de edición es el método más utilizado para cuantificar la similitud entre dos cadenas. Investigamos el problema de la búsqueda de similitud bajo la distancia de edición. Dada una colección de secuencias, el objetivo de la búsqueda de similitud bajo la distancia de edición es encontrar secuencias en la colección que sean similares a una secuencia de consulta dada, donde la puntuación de similitud se calcula utilizando la distancia de edición. El método canónico para calcular la distancia de edición entre dos cadenas utiliza un enfoque basado en programación dinámica que se ejecuta en tiempo y espacio cuadrático, lo que puede no proporcionar resultados en un tiempo razonable para secuencias grandes. Se aboga por algoritmos paralelos para reducir el tiempo requerido por el cálculo de la distancia de edición. Con este fin, presentamos algoritmos paralelos escalables para apoyar una búsqueda de similitud eficiente bajo la distancia de edición. La eficiencia y escalabilidad de los algoritmos propuestos se demuestra a través de un extenso conjunto de experimentos en conjuntos de datos reales. Además, para abordar el problema de la carga de trabajo desigual entre diferentes unidades de procesamiento, que se debe principalmente a la variación significativa en el tamaño de las secuencias, se discuten y analizan empíricamente diferentes esquemas de distribución de datos. Los resultados experimentales han mostrado que la aceleración lograda por el enfoque híbrido sobre el paralelismo inter-tarea e intra-tarea es de 18 y 13, respectivamente.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro