Explotando estadísticas escasas para una predicción basada en secuencias del efecto de mutaciones
Autores: Mezei, Mihaly
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Explotando estadísticas escasas para una predicción basada en secuencias del efecto de mutaciones
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Diferencia significativa
Tripletes de aminoácidos
Proteínas plegadas
Estadísticas
Predicciones de plegabilidad
Cambio de estabilidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Un trabajo reciente mostró que existe una diferencia significativa entre las estadísticas de tripletes y cuádruplos de aminoácidos en secuencias de proteínas plegadas y secuencias generadas aleatoriamente. Estas estadísticas se utilizaron para asignar una puntuación a cada secuencia y hacer una predicción sobre si una secuencia es probable que se pliegue. El presente documento extiende las estadísticas a multipletes más altos y sugiere una forma de manejar el tratamiento de multipletes que no se encontraron en el conjunto de proteínas plegadas. En particular, las predicciones de plegabilidad se realizaron siguiendo la línea del trabajo anterior utilizando estadísticas de pentupletes y se encontró una forma de combinar las estadísticas de cuádruplos y pentupletes para mejorar las predicciones de plegabilidad. Se definió un puntaje diferente y más simple para hextupletes y heptupletes que se utilizaron para predecir la dirección del cambio de estabilidad de una proteína tras una mutación. Con la mejor combinación de puntajes, la precisión de la predicción fue del 73.4%.
Descripción
Un trabajo reciente mostró que existe una diferencia significativa entre las estadísticas de tripletes y cuádruplos de aminoácidos en secuencias de proteínas plegadas y secuencias generadas aleatoriamente. Estas estadísticas se utilizaron para asignar una puntuación a cada secuencia y hacer una predicción sobre si una secuencia es probable que se pliegue. El presente documento extiende las estadísticas a multipletes más altos y sugiere una forma de manejar el tratamiento de multipletes que no se encontraron en el conjunto de proteínas plegadas. En particular, las predicciones de plegabilidad se realizaron siguiendo la línea del trabajo anterior utilizando estadísticas de pentupletes y se encontró una forma de combinar las estadísticas de cuádruplos y pentupletes para mejorar las predicciones de plegabilidad. Se definió un puntaje diferente y más simple para hextupletes y heptupletes que se utilizaron para predecir la dirección del cambio de estabilidad de una proteína tras una mutación. Con la mejor combinación de puntajes, la precisión de la predicción fue del 73.4%.