Un conjunto de datos de referencia para evaluar el rendimiento práctico de la evaluación de la calidad del modelo de homología
Autores: Takei, Yuma; Ishida, Takashi
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un conjunto de datos de referencia para evaluar el rendimiento práctico de la evaluación de la calidad del modelo de homología
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Predicción de la estructura de proteínas
Evaluación de calidad del modelo
MQA
Conjunto de datos CASP
Modelado de homología
Conjuntos de datos de referencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La predicción de la estructura de proteínas es un tema importante en bioinformática estructural. En este proceso, la evaluación de la calidad del modelo (MQA), que estima la precisión de la estructura predicha, también es prácticamente importante. Actualmente, el conjunto de datos más utilizado para evaluar el rendimiento de MQA es el conjunto de datos de evaluación crítica de la predicción de la estructura de proteínas (CASP). Sin embargo, el conjunto de datos CASP no contiene suficientes objetivos con modelos de alta calidad y, por lo tanto, no puede evaluar suficientemente el rendimiento de MQA en el uso práctico. Además, la mayoría de los estudios de aplicación emplean el modelado de homología debido a su fiabilidad. Sin embargo, el conjunto de datos CASP incluye modelos generados por métodos de novo, lo que puede llevar a la mala estimación del rendimiento de MQA. En este estudio, creamos nuevos conjuntos de datos de referencia, llamados un conjunto de datos de modelos de homología para evaluación de calidad del modelo (HMDM), que contienen objetivos con modelos de alta calidad derivados utilizando el modelado de homología. Luego, comparamos el rendimiento de los métodos de MQA utilizando los nuevos conjuntos de datos y los comparamos con el rendimiento de la selección clásica basada en la identidad de secuencia de las proteínas de plantilla. Los resultados mostraron que la selección de modelos por los últimos métodos de MQA utilizando aprendizaje profundo es mejor que la selección por identidad de secuencia de plantilla y potenciales estadísticos clásicos. Utilizando HMDM, es posible verificar el rendimiento de MQA para modelos de homología de alta precisión.
Descripción
La predicción de la estructura de proteínas es un tema importante en bioinformática estructural. En este proceso, la evaluación de la calidad del modelo (MQA), que estima la precisión de la estructura predicha, también es prácticamente importante. Actualmente, el conjunto de datos más utilizado para evaluar el rendimiento de MQA es el conjunto de datos de evaluación crítica de la predicción de la estructura de proteínas (CASP). Sin embargo, el conjunto de datos CASP no contiene suficientes objetivos con modelos de alta calidad y, por lo tanto, no puede evaluar suficientemente el rendimiento de MQA en el uso práctico. Además, la mayoría de los estudios de aplicación emplean el modelado de homología debido a su fiabilidad. Sin embargo, el conjunto de datos CASP incluye modelos generados por métodos de novo, lo que puede llevar a la mala estimación del rendimiento de MQA. En este estudio, creamos nuevos conjuntos de datos de referencia, llamados un conjunto de datos de modelos de homología para evaluación de calidad del modelo (HMDM), que contienen objetivos con modelos de alta calidad derivados utilizando el modelado de homología. Luego, comparamos el rendimiento de los métodos de MQA utilizando los nuevos conjuntos de datos y los comparamos con el rendimiento de la selección clásica basada en la identidad de secuencia de las proteínas de plantilla. Los resultados mostraron que la selección de modelos por los últimos métodos de MQA utilizando aprendizaje profundo es mejor que la selección por identidad de secuencia de plantilla y potenciales estadísticos clásicos. Utilizando HMDM, es posible verificar el rendimiento de MQA para modelos de homología de alta precisión.