Búsqueda de Similitud Local para Encontrar Indicadores Genéticos en Genomas Mitocondriales
Autores: Moritz, Ruby L. V.; Bernt, Matthias; Middendorf, Martin
Idioma: Inglés
Editor: MDPI
Año: 2014
Acceso abierto
Artículo científico
2014
Búsqueda de Similitud Local para Encontrar Indicadores Genéticos en Genomas Mitocondriales
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Secuencias de nucleótidos
Subcadenas conservadas
Genes homólogos
árbol de sufijos
Versión truncada
Detección de marcadores
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
Dado un conjunto de secuencias de nucleótidos, consideramos el problema de identificar subcadenas conservadas que ocurren en genes homólogos en un gran número de secuencias. El problema se resuelve identificando ciertos nodos en un árbol de sufijos que contiene todas las subcadenas que ocurren en las secuencias de nucleótidos dadas. Debido al gran tamaño del conjunto de datos objetivo, nuestro enfoque emplea una versión truncada de los árboles de sufijos. Se introducen dos métodos para esta tarea: (1) El método de detección de marcadores guiado por anotaciones utiliza anotaciones de genes que pueden contener un número moderado de errores; (2) El método de detección de marcadores basado en probabilidades determina secuencias que aparecen significativamente más a menudo de lo esperado. El enfoque se aplica con éxito a las secuencias de nucleótidos mitocondriales y las anotaciones correspondientes que están disponibles en RefSeq para 2989 especies de metazoos. Demostramos que el enfoque encuentra subcadenas apropiadas.
Descripción
Dado un conjunto de secuencias de nucleótidos, consideramos el problema de identificar subcadenas conservadas que ocurren en genes homólogos en un gran número de secuencias. El problema se resuelve identificando ciertos nodos en un árbol de sufijos que contiene todas las subcadenas que ocurren en las secuencias de nucleótidos dadas. Debido al gran tamaño del conjunto de datos objetivo, nuestro enfoque emplea una versión truncada de los árboles de sufijos. Se introducen dos métodos para esta tarea: (1) El método de detección de marcadores guiado por anotaciones utiliza anotaciones de genes que pueden contener un número moderado de errores; (2) El método de detección de marcadores basado en probabilidades determina secuencias que aparecen significativamente más a menudo de lo esperado. El enfoque se aplica con éxito a las secuencias de nucleótidos mitocondriales y las anotaciones correspondientes que están disponibles en RefSeq para 2989 especies de metazoos. Demostramos que el enfoque encuentra subcadenas apropiadas.