Garantía de diversidad y optimalidad en métodos de diseño computacional de proteínas basados en redes de funciones de costo
Autores: Ruffini, Manon; Vucinic, Jelena; de Givry, Simon; Katsirelos, George; Barbe, Sophie; Schiex, Thomas
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Garantía de diversidad y optimalidad en métodos de diseño computacional de proteínas basados en redes de funciones de costo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Proteínas
Proteínas modificadas
Diseño computacional de proteínas
Modelos moleculares
Optimización energética
Restricciones de diversidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Las proteínas son las moléculas activas principales de la vida. Aunque las proteínas naturales desempeñan muchos roles, como enzimas o anticuerpos, por ejemplo, hay una necesidad de ir más allá del repertorio de proteínas naturales para producir proteínas diseñadas que cumplan precisamente con los requisitos de aplicación, en términos de función, estabilidad, actividad u otras capacidades proteicas. El Diseño Computacional de Proteínas tiene como objetivo diseñar nuevas proteínas desde principios fundamentales, utilizando modelos moleculares de átomos completos. Sin embargo, el tamaño y la complejidad de las proteínas requieren aproximaciones para hacerlas susceptibles a consultas de optimización energética. Estas aproximaciones hacen que el proceso de diseño sea menos confiable y una solución óptima comprobable puede fallar. En la práctica, por lo tanto, se generan y prueban bibliotecas costosas de soluciones. En este documento, exploramos la idea de generar bibliotecas de soluciones de baja energía diversificadas de manera comprobable mediante la ampliación de algoritmos de red de funciones de costo con restricciones de diversidad basadas en autómatas en un gran conjunto de problemas realistas de rediseno completo de proteínas. Observamos que es posible generar bibliotecas diversificadas de manera comprobable en un tiempo razonable y que las bibliotecas producidas mejoran la Recuperación de Secuencia Nativa, una medida tradicional de la confiabilidad de los métodos de diseño.
Descripción
Las proteínas son las moléculas activas principales de la vida. Aunque las proteínas naturales desempeñan muchos roles, como enzimas o anticuerpos, por ejemplo, hay una necesidad de ir más allá del repertorio de proteínas naturales para producir proteínas diseñadas que cumplan precisamente con los requisitos de aplicación, en términos de función, estabilidad, actividad u otras capacidades proteicas. El Diseño Computacional de Proteínas tiene como objetivo diseñar nuevas proteínas desde principios fundamentales, utilizando modelos moleculares de átomos completos. Sin embargo, el tamaño y la complejidad de las proteínas requieren aproximaciones para hacerlas susceptibles a consultas de optimización energética. Estas aproximaciones hacen que el proceso de diseño sea menos confiable y una solución óptima comprobable puede fallar. En la práctica, por lo tanto, se generan y prueban bibliotecas costosas de soluciones. En este documento, exploramos la idea de generar bibliotecas de soluciones de baja energía diversificadas de manera comprobable mediante la ampliación de algoritmos de red de funciones de costo con restricciones de diversidad basadas en autómatas en un gran conjunto de problemas realistas de rediseno completo de proteínas. Observamos que es posible generar bibliotecas diversificadas de manera comprobable en un tiempo razonable y que las bibliotecas producidas mejoran la Recuperación de Secuencia Nativa, una medida tradicional de la confiabilidad de los métodos de diseño.