Análisis filogenéticos de sitios en diferentes entornos estructurales de proteínas resultan en colocaciones distintas de la raíz metazoana
Autores: Pandey, Akanksha; Braun, Edward L.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Análisis filogenéticos de sitios en diferentes entornos estructurales de proteínas resultan en colocaciones distintas de la raíz metazoana
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Filogenómica
Relaciones evolutivas
Conjuntos de datos de proteínas
Estructura secundaria
Accesibilidad al solvente
Aminoácidos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
La filogenómica, el uso de grandes conjuntos de datos para examinar la filogenia, ha revolucionado el estudio de las relaciones evolutivas. Sin embargo, los datos a escala genómica no han podido resolver todas las relaciones en el árbol de la vida; esto podría reflejar, al menos en parte, el mal ajuste de los modelos utilizados para analizar conjuntos de datos heterogéneos. Parte de la heterogeneidad puede reflejar los diferentes patrones de selección sobre las proteínas según sus estructuras. Para probar esa hipótesis, desarrollamos un proceso para dividir conjuntos de datos de proteínas filogenómicas en subconjuntos basados en la estructura secundaria y la accesibilidad relativa al solvente. Luego probamos si los aminoácidos en diferentes entornos estructurales tenían señales distintas para la topología de las ramas más profundas en el árbol de los metazoos. Nos centramos en un conjunto de datos que parecía tener una mezcla de señales y encontramos que la diferencia más notable en la señal filogenética reflejaba la accesibilidad relativa al solvente. Los análisis de sitios expuestos (residuos ubicados en la superficie de las proteínas) produjeron un árbol que colocaba a los ctenóforos como hermanas de todos los demás animales, mientras que los sitios enterrados dentro de las proteínas generaron un árbol con un clado de esponjas+ctenóforos. Estas diferencias en la señal filogenética no se mejoraron cuando realizamos análisis utilizando un conjunto de modelos de mezcla de perfiles de máxima verosimilitud. Estos modelos son muy similares al modelo bayesiano CAT, que se ha utilizado en muchos análisis de filogenia metazoica profunda. En contraste, los análisis realizados después de recodificar los aminoácidos para limitar el impacto de las desviaciones de la estacionaridad composicional aumentaron la congruencia en las estimaciones de filogenia para sitios expuestos y enterrados; después de recodificar, los árboles de aminoácidos estimados utilizando los sitios expuestos y enterrados apoyaron ambos la colocación de los ctenóforos como hermanas de todos los demás animales. Aunque la conclusión central de nuestros análisis es que los sitios en diferentes entornos estructurales producen árboles distintos cuando se analizan utilizando modelos de evolución de proteínas, nuestros análisis de recodificación de aminoácidos también tienen implicaciones para la evolución de los metazoos. Específicamente, nuestros resultados añaden evidencia de que los ctenóforos son el grupo hermano de todos los demás animales y sugieren además que el clado placozoa+cnidaria encontrado en algunos otros estudios merece más atención. Tomados en su conjunto, estos resultados proporcionan evidencia sorprendente de que es necesario lograr una mejor comprensión de las limitaciones debidas a la estructura de las proteínas para mejorar la estimación filogenética.
Descripción
La filogenómica, el uso de grandes conjuntos de datos para examinar la filogenia, ha revolucionado el estudio de las relaciones evolutivas. Sin embargo, los datos a escala genómica no han podido resolver todas las relaciones en el árbol de la vida; esto podría reflejar, al menos en parte, el mal ajuste de los modelos utilizados para analizar conjuntos de datos heterogéneos. Parte de la heterogeneidad puede reflejar los diferentes patrones de selección sobre las proteínas según sus estructuras. Para probar esa hipótesis, desarrollamos un proceso para dividir conjuntos de datos de proteínas filogenómicas en subconjuntos basados en la estructura secundaria y la accesibilidad relativa al solvente. Luego probamos si los aminoácidos en diferentes entornos estructurales tenían señales distintas para la topología de las ramas más profundas en el árbol de los metazoos. Nos centramos en un conjunto de datos que parecía tener una mezcla de señales y encontramos que la diferencia más notable en la señal filogenética reflejaba la accesibilidad relativa al solvente. Los análisis de sitios expuestos (residuos ubicados en la superficie de las proteínas) produjeron un árbol que colocaba a los ctenóforos como hermanas de todos los demás animales, mientras que los sitios enterrados dentro de las proteínas generaron un árbol con un clado de esponjas+ctenóforos. Estas diferencias en la señal filogenética no se mejoraron cuando realizamos análisis utilizando un conjunto de modelos de mezcla de perfiles de máxima verosimilitud. Estos modelos son muy similares al modelo bayesiano CAT, que se ha utilizado en muchos análisis de filogenia metazoica profunda. En contraste, los análisis realizados después de recodificar los aminoácidos para limitar el impacto de las desviaciones de la estacionaridad composicional aumentaron la congruencia en las estimaciones de filogenia para sitios expuestos y enterrados; después de recodificar, los árboles de aminoácidos estimados utilizando los sitios expuestos y enterrados apoyaron ambos la colocación de los ctenóforos como hermanas de todos los demás animales. Aunque la conclusión central de nuestros análisis es que los sitios en diferentes entornos estructurales producen árboles distintos cuando se analizan utilizando modelos de evolución de proteínas, nuestros análisis de recodificación de aminoácidos también tienen implicaciones para la evolución de los metazoos. Específicamente, nuestros resultados añaden evidencia de que los ctenóforos son el grupo hermano de todos los demás animales y sugieren además que el clado placozoa+cnidaria encontrado en algunos otros estudios merece más atención. Tomados en su conjunto, estos resultados proporcionan evidencia sorprendente de que es necesario lograr una mejor comprensión de las limitaciones debidas a la estructura de las proteínas para mejorar la estimación filogenética.