Pesca genómica y procesamiento de datos para la investigación de la evolución molecular
Autores: Lorente-Martínez, Héctor; Agorreta, Ainhoa; San Mauro, Diego
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Pesca genómica y procesamiento de datos para la investigación de la evolución molecular
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Análisis de evolución molecular
Selección adaptativa/purificadora
Reconstrucción de proteínas ancestrales
Alineamiento de secuencias
Modelo de evolución
árbol filogenético
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Los análisis de evolución molecular, como la detección de selección adaptativa/purificadora o la reconstrucción de proteínas ancestrales, suelen requerir tres entradas para un gen objetivo (o familia de genes) en un grupo particular de organismos: alineación de secuencias, modelo de evolución y árbol filogenético. Aunque los avances modernos en técnicas de secuenciación de alto rendimiento han llevado a una acumulación rápida de datos a escala genómica en repositorios públicos y bases de datos, la extracción de tanta información a menudo sigue siendo un desafío. Aquí, describimos un flujo de trabajo completo y versátil destinado a la preparación de conjuntos de datos extraídos del genoma listos para la investigación de evolución molecular. El flujo de trabajo implica: (1) búsqueda y captura de secuencias génicas específicas de interés de datos genómicos taxonómicamente diversos disponibles en bases de datos a diferentes niveles de anotación, (2) procesamiento y depuración de secuencias recuperadas, (3) producción de una alineación de múltiples secuencias, (4) selección del mejor modelo de evolución y (5) reconstrucción sólida de un árbol filogenético.
Descripción
Los análisis de evolución molecular, como la detección de selección adaptativa/purificadora o la reconstrucción de proteínas ancestrales, suelen requerir tres entradas para un gen objetivo (o familia de genes) en un grupo particular de organismos: alineación de secuencias, modelo de evolución y árbol filogenético. Aunque los avances modernos en técnicas de secuenciación de alto rendimiento han llevado a una acumulación rápida de datos a escala genómica en repositorios públicos y bases de datos, la extracción de tanta información a menudo sigue siendo un desafío. Aquí, describimos un flujo de trabajo completo y versátil destinado a la preparación de conjuntos de datos extraídos del genoma listos para la investigación de evolución molecular. El flujo de trabajo implica: (1) búsqueda y captura de secuencias génicas específicas de interés de datos genómicos taxonómicamente diversos disponibles en bases de datos a diferentes niveles de anotación, (2) procesamiento y depuración de secuencias recuperadas, (3) producción de una alineación de múltiples secuencias, (4) selección del mejor modelo de evolución y (5) reconstrucción sólida de un árbol filogenético.