Evaluación de la Efectividad de las Características Derivadas de AlphaFold2 en la Predicción del Sitio de Unión de Proteínas de Secuencia Única
Autores: Liu, Zhe; Pan, Weihao; Li, Weihao; Zhen, Xuyang; Liang, Jisheng; Cai, Wenxiang; Xu, Fei; Yuan, Kai; Lin, Guan Ning
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Evaluación de la Efectividad de las Características Derivadas de AlphaFold2 en la Predicción del Sitio de Unión de Proteínas de Secuencia Única
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Predicción de la estructura de proteínas
Redes de aprendizaje profundo
Estrategias de procesamiento
Coordenadas
Tareas posteriores
Información estructural
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 14
Citaciones: Sin citaciones
Aunque AlphaFold2 ha alcanzado una precisión considerablemente alta en la predicción de la estructura de proteínas, se informa que introducir directamente coordenadas en redes de aprendizaje profundo no puede lograr resultados deseables en tareas posteriores. Por lo tanto, cómo procesar y codificar los resultados predichos en formas efectivas que los modelos de aprendizaje profundo puedan entender para mejorar el rendimiento de las tareas posteriores merece ser explorado. En este estudio, probamos los efectos de cinco estrategias de procesamiento de coordenadas en dos tareas de predicción de sitios de unión de proteínas de secuencia única. Estas cinco estrategias son filtrado espacial, la descomposición en valores singulares de un mapa de distancias, el cálculo de la característica de estructura secundaria y la característica de área de superficie accesible relativa de las proteínas. Los resultados del experimento computacional mostraron que todas las estrategias eran métodos adecuados y efectivos para codificar información estructural para modelos de aprendizaje profundo. Además, al realizar un estudio de caso de una proteína mutada, mostramos que la estrategia de filtrado espacial podría introducir cambios estructurales en los perfiles de HHblits y en las redes de aprendizaje profundo cuando ocurre una mutación en la proteína. En resumen, este trabajo proporciona una nueva perspectiva sobre las tareas posteriores de predicción de interacción proteína-molécula, como predecir los residuos de unión de proteínas y estimar los efectos de las mutaciones.
Descripción
Aunque AlphaFold2 ha alcanzado una precisión considerablemente alta en la predicción de la estructura de proteínas, se informa que introducir directamente coordenadas en redes de aprendizaje profundo no puede lograr resultados deseables en tareas posteriores. Por lo tanto, cómo procesar y codificar los resultados predichos en formas efectivas que los modelos de aprendizaje profundo puedan entender para mejorar el rendimiento de las tareas posteriores merece ser explorado. En este estudio, probamos los efectos de cinco estrategias de procesamiento de coordenadas en dos tareas de predicción de sitios de unión de proteínas de secuencia única. Estas cinco estrategias son filtrado espacial, la descomposición en valores singulares de un mapa de distancias, el cálculo de la característica de estructura secundaria y la característica de área de superficie accesible relativa de las proteínas. Los resultados del experimento computacional mostraron que todas las estrategias eran métodos adecuados y efectivos para codificar información estructural para modelos de aprendizaje profundo. Además, al realizar un estudio de caso de una proteína mutada, mostramos que la estrategia de filtrado espacial podría introducir cambios estructurales en los perfiles de HHblits y en las redes de aprendizaje profundo cuando ocurre una mutación en la proteína. En resumen, este trabajo proporciona una nueva perspectiva sobre las tareas posteriores de predicción de interacción proteína-molécula, como predecir los residuos de unión de proteínas y estimar los efectos de las mutaciones.