Clasificación automática de la estructura de proteínas utilizando la métrica de superposición de mapas de contacto máximo
Autores: Andonov, Rumen; Djidjev, Hristo; Klau, Gunnar W.; Le Boudic-Jamin, Mathilde; Wohlers, Inken
Idioma: Inglés
Editor: MDPI
Año: 2015
Acceso abierto
Artículo científico
2015
Clasificación automática de la estructura de proteínas utilizando la métrica de superposición de mapas de contacto máximo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Propuesto
Medida de distancia
Estructuras de proteínas
Mapa de contactos
Métrica
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
En este trabajo, proponemos una nueva medida de distancia para comparar dos estructuras de proteínas basadas en sus representaciones de mapa de contactos. Mostramos que nuestra medida novedosa, a la que nos referimos como la métrica de superposición máxima de mapas de contacto (max-CMO), cumple con todas las propiedades de una métrica en el espacio de representaciones de proteínas. Tener una métrica en ese espacio permite evitar comparaciones de pares en toda la base de datos y, por lo tanto, acelerar significativamente la exploración del espacio de proteínas en comparación con espacios sin métrica. Mostramos en un conjunto de referencia de clasificación de super familias estándar de oro de 6759 proteínas que nuestro esquema de vecino más cercano exacto clasifica hasta 224 de 236 consultas correctamente y en una versión ampliada más grande del conjunto de referencia con 60,850 estructuras adicionales, hasta 1361 de 1369 consultas. Nuestra clasificación de vecino más cercano proporciona así un enfoque prometedor para la clasificación automática de estructuras de proteínas basada en alineamientos flexibles de superposición de mapas de contacto.
Descripción
En este trabajo, proponemos una nueva medida de distancia para comparar dos estructuras de proteínas basadas en sus representaciones de mapa de contactos. Mostramos que nuestra medida novedosa, a la que nos referimos como la métrica de superposición máxima de mapas de contacto (max-CMO), cumple con todas las propiedades de una métrica en el espacio de representaciones de proteínas. Tener una métrica en ese espacio permite evitar comparaciones de pares en toda la base de datos y, por lo tanto, acelerar significativamente la exploración del espacio de proteínas en comparación con espacios sin métrica. Mostramos en un conjunto de referencia de clasificación de super familias estándar de oro de 6759 proteínas que nuestro esquema de vecino más cercano exacto clasifica hasta 224 de 236 consultas correctamente y en una versión ampliada más grande del conjunto de referencia con 60,850 estructuras adicionales, hasta 1361 de 1369 consultas. Nuestra clasificación de vecino más cercano proporciona así un enfoque prometedor para la clasificación automática de estructuras de proteínas basada en alineamientos flexibles de superposición de mapas de contacto.