Un metodología de predicción de péptidos con fragmentos y CNN para estructura terciaria basado en GRSA2
Autores: Sánchez-Hernández, Juan P.; Frausto-Solís, Juan; Soto-Monterrubio, Diego A.; González-Barbosa, Juan J.; Roman-Rangel, Edgar
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un metodología de predicción de péptidos con fragmentos y CNN para estructura terciaria basado en GRSA2
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Proteínas
Estructura nativa
Problema del plegamiento de proteínas
Métodos computacionales
I-TASSER
AlphaFold2
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Las proteínas son macromoléculas esenciales para los organismos vivos. Sin embargo, para desempeñar su función, las proteínas necesitan alcanzar su Estructura Nativa (EN). La EN se alcanza rápidamente en la naturaleza. Por el contrario, in silico, se obtiene resolviendo el problema de Plegamiento de Proteínas (PFP), que actualmente tiene un largo tiempo de ejecución. El PFP es computacionalmente un problema NP-duro y se considera uno de los mayores desafíos actuales. Existen varios métodos que siguen diferentes estrategias para resolver el PFP. Los más exitosos combinan métodos computacionales e información biológica: I-TASSER, Rosetta (servidor Robetta), AlphaFold2 (Campeón CASP14), QUARK, PEP-FOLD3, TopModel y GRSA2-SSP. Los tres primeros métodos mencionados obtuvieron la mayor calidad en eventos CASP, y todos aplican el Recocido Simulado o el método de Monte Carlo, Redes Neuronales y metodologías de ensamblaje de fragmentos. En el presente trabajo, proponemos la metodología GRSA2-FCNN, que ensambla fragmentos aplicados a péptidos y se basa en GRSA2 y Redes Neuronales Convolucionales (CNN). Comparamos GRSA2-FCNN con los mejores algoritmos de vanguardia para PFP, como I-TASSER, Rosetta, AlphaFold2, QUARK, PEP-FOLD3, TopModel y GRSA2-SSP. Nuestra metodología se aplica a un conjunto de datos de 60 péptidos y logra el mejor rendimiento de todos los métodos probados basados en las métricas comunes TM-score, RMSD y GDT-TS del área.
Descripción
Las proteínas son macromoléculas esenciales para los organismos vivos. Sin embargo, para desempeñar su función, las proteínas necesitan alcanzar su Estructura Nativa (EN). La EN se alcanza rápidamente en la naturaleza. Por el contrario, in silico, se obtiene resolviendo el problema de Plegamiento de Proteínas (PFP), que actualmente tiene un largo tiempo de ejecución. El PFP es computacionalmente un problema NP-duro y se considera uno de los mayores desafíos actuales. Existen varios métodos que siguen diferentes estrategias para resolver el PFP. Los más exitosos combinan métodos computacionales e información biológica: I-TASSER, Rosetta (servidor Robetta), AlphaFold2 (Campeón CASP14), QUARK, PEP-FOLD3, TopModel y GRSA2-SSP. Los tres primeros métodos mencionados obtuvieron la mayor calidad en eventos CASP, y todos aplican el Recocido Simulado o el método de Monte Carlo, Redes Neuronales y metodologías de ensamblaje de fragmentos. En el presente trabajo, proponemos la metodología GRSA2-FCNN, que ensambla fragmentos aplicados a péptidos y se basa en GRSA2 y Redes Neuronales Convolucionales (CNN). Comparamos GRSA2-FCNN con los mejores algoritmos de vanguardia para PFP, como I-TASSER, Rosetta, AlphaFold2, QUARK, PEP-FOLD3, TopModel y GRSA2-SSP. Nuestra metodología se aplica a un conjunto de datos de 60 péptidos y logra el mejor rendimiento de todos los métodos probados basados en las métricas comunes TM-score, RMSD y GDT-TS del área.