Búsqueda de supergrafos similares basada en la distancia de edición de grafos
Autores: Yamada, Masataka; Inokuchi, Akihiro
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Búsqueda de supergrafos similares basada en la distancia de edición de grafos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Gráfico
Métodos de búsqueda
Subgráfico
Supergráfico
Compuestos
Algoritmo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Los métodos de búsqueda de subgrafo y supergrafo son técnicas prometedoras para el desarrollo de nuevos medicamentos. Por ejemplo, la estructura química de favipiravir, un tratamiento antiviral para la influenza, se asemeja a la estructura de algunos componentes de ARN. Representados como gráficos, tales compuestos son similares a un subgrafo de favipiravir. Sin embargo, los métodos de búsqueda de supergrafo existentes solo pueden descubrir compuestos que coincidan exactamente. Proponemos un problema novedoso, denominado búsqueda de supergrafo similar, y diseñamos un algoritmo eficiente para resolverlo. El problema consiste en identificar todos los gráficos en una base de datos que sean similares a cualquier subgrafo de un gráfico de consulta, donde la similitud se define como distancia de edición. Nuestro algoritmo representa el conjunto de subgráficos candidatos mediante un árbol de códigos, que utiliza para calcular eficientemente la distancia de edición. Con un umbral de distancia de cero, nuestro algoritmo es equivalente a un algoritmo eficiente existente para la búsqueda exacta de supergrafo. Nuestros experimentos muestran que el tiempo de cálculo aumentó exponencialmente a medida que aumentaba el umbral de distancia, pero aumentó de forma sublineal con el número de gráficos en la base de datos.
Descripción
Los métodos de búsqueda de subgrafo y supergrafo son técnicas prometedoras para el desarrollo de nuevos medicamentos. Por ejemplo, la estructura química de favipiravir, un tratamiento antiviral para la influenza, se asemeja a la estructura de algunos componentes de ARN. Representados como gráficos, tales compuestos son similares a un subgrafo de favipiravir. Sin embargo, los métodos de búsqueda de supergrafo existentes solo pueden descubrir compuestos que coincidan exactamente. Proponemos un problema novedoso, denominado búsqueda de supergrafo similar, y diseñamos un algoritmo eficiente para resolverlo. El problema consiste en identificar todos los gráficos en una base de datos que sean similares a cualquier subgrafo de un gráfico de consulta, donde la similitud se define como distancia de edición. Nuestro algoritmo representa el conjunto de subgráficos candidatos mediante un árbol de códigos, que utiliza para calcular eficientemente la distancia de edición. Con un umbral de distancia de cero, nuestro algoritmo es equivalente a un algoritmo eficiente existente para la búsqueda exacta de supergrafo. Nuestros experimentos muestran que el tiempo de cálculo aumentó exponencialmente a medida que aumentaba el umbral de distancia, pero aumentó de forma sublineal con el número de gráficos en la base de datos.