Rápida alineación estructural de biomoléculas utilizando una tabla hash, n-gramas y descriptores de cadena
Autores: Bauer, Raphael André; Rother, Kristian; Moor, Peter; Reinert, Knut; Steinke, Thomas; Bujnicki, Janusz M.; Preissner, Robert
Idioma: Inglés
Editor: MDPI
Año: 2009
Acceso abierto
Artículo científico
2009
Rápida alineación estructural de biomoléculas utilizando una tabla hash, n-gramas y descriptores de cadena
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Alineación estructural
Estructuras macromoleculares
Tabla hash
N-gramas
Proteína
ARN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Este trabajo presenta un enfoque generalizado para la alineación estructural rápida de miles de estructuras macromoleculares. El método utiliza representaciones de cadenas de una estructura macromolecular y una tabla hash que almacena n-gramas de un cierto tamaño para la búsqueda. Con este fin, se implementaron traductores de estructuras macromoleculares a cadenas para proteínas y estructuras de ARN. Una consulta contra el índice se realiza en dos pasos jerárquicos para unir velocidad y precisión. En el primer paso, la estructura de consulta se traduce en n-gramas, y todas las estructuras objetivo que contienen estos n-gramas se recuperan de la tabla hash. En el segundo paso, todos los n-gramas correspondientes de la consulta y cada estructura objetivo se alinean posteriormente, y después de cada alineación se calcula una puntuación basada en los n-gramas coincidentes de la consulta y el objetivo. El marco ampliable permite al usuario consultar y alinear estructuralmente miles de estructuras de proteínas y ARN en una máquina estándar y está disponible como código abierto desde .
Descripción
Este trabajo presenta un enfoque generalizado para la alineación estructural rápida de miles de estructuras macromoleculares. El método utiliza representaciones de cadenas de una estructura macromolecular y una tabla hash que almacena n-gramas de un cierto tamaño para la búsqueda. Con este fin, se implementaron traductores de estructuras macromoleculares a cadenas para proteínas y estructuras de ARN. Una consulta contra el índice se realiza en dos pasos jerárquicos para unir velocidad y precisión. En el primer paso, la estructura de consulta se traduce en n-gramas, y todas las estructuras objetivo que contienen estos n-gramas se recuperan de la tabla hash. En el segundo paso, todos los n-gramas correspondientes de la consulta y cada estructura objetivo se alinean posteriormente, y después de cada alineación se calcula una puntuación basada en los n-gramas coincidentes de la consulta y el objetivo. El marco ampliable permite al usuario consultar y alinear estructuralmente miles de estructuras de proteínas y ARN en una máquina estándar y está disponible como código abierto desde .