Descubriendo efectos a partir de la estructura de secuencias de metabarcodes para análisis metagenéticos y de microbiomas
Autores: Molik, David C.; Pfrender, Michael E.; Emrich, Scott J.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Descubriendo efectos a partir de la estructura de secuencias de metabarcodes para análisis metagenéticos y de microbiomas
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Secuenciación de próxima generación
Especies
Diversidad
Unidades taxonómicas operativas
Variantes de secuencia de amplicón
Minhash
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
El advenimiento de la secuenciación de próxima generación ha permitido determinar con mayor eficiencia qué especies viven en una ubicación específica. Aquí establecemos que tres métodos de análisis para estimar la diversidad dentro de las muestras, a saber, Unidades Taxonómicas Operativas; las Variantes de Secuencia de Amplicón más recientes; y un método comúnmente encontrado en el análisis de secuencias, minhash, se ven afectados por varias propiedades de estos datos de secuencia. Mediante simulaciones mostramos que la presencia de Polimorfismos de Nucleótido Único y la profundidad de cobertura de cada especie afectan las correlaciones entre estos enfoques. A través de este análisis, proporcionamos información que afectaría las decisiones sobre la aplicación de cada método. Específicamente, la presencia de errores en la lectura de secuencias y la variabilidad en la cobertura de lectura de secuencias afectan de manera diferencial a estos métodos de procesamiento.
Descripción
El advenimiento de la secuenciación de próxima generación ha permitido determinar con mayor eficiencia qué especies viven en una ubicación específica. Aquí establecemos que tres métodos de análisis para estimar la diversidad dentro de las muestras, a saber, Unidades Taxonómicas Operativas; las Variantes de Secuencia de Amplicón más recientes; y un método comúnmente encontrado en el análisis de secuencias, minhash, se ven afectados por varias propiedades de estos datos de secuencia. Mediante simulaciones mostramos que la presencia de Polimorfismos de Nucleótido Único y la profundidad de cobertura de cada especie afectan las correlaciones entre estos enfoques. A través de este análisis, proporcionamos información que afectaría las decisiones sobre la aplicación de cada método. Específicamente, la presencia de errores en la lectura de secuencias y la variabilidad en la cobertura de lectura de secuencias afectan de manera diferencial a estos métodos de procesamiento.