logo móvil
Contáctanos

Identificación de Interacciones Proteicas Relevantes con Conocimiento Parcial: Un Enfoque de Red Compleja y Aprendizaje Profundo

Autores: Ortiz-Vilchis, Pilar; De-la-Cruz-García, Jazmin-Susana; Ramirez-Arellano, Aldo

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Identificación de Interacciones Proteicas Relevantes con Conocimiento Parcial: Un Enfoque de Red Compleja y Aprendizaje Profundo


Categoría

Ciencias Naturales y Subdisciplinas

Subcategoría

Biología

Palabras clave

Interacciones proteína-proteína
Aprendizaje automático
Análisis de redes
LSTM
Método fractal
Redes PPI

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
Las interacciones proteína-proteína (PPIs) son la base para entender la mayoría de los eventos celulares en los sistemas biológicos. Se han utilizado varios métodos experimentales, como métodos bioquímicos, moleculares y genéticos, para identificar asociaciones proteína-proteína. Sin embargo, algunos de ellos, como la espectrometría de masas, son lentos y costosos. Las técnicas de aprendizaje automático (ML) se han utilizado ampliamente para caracterizar las PPIs, aumentando el número de proteínas analizadas simultáneamente y optimizando el tiempo y los recursos para identificar y predecir los vínculos funcionales entre proteínas. Los enfoques anteriores de ML se han centrado en redes bien conocidas o en objetivos específicos, pero no en identificar proteínas relevantes con conocimiento parcial o nulo de las redes de interacción. El enfoque propuesto tiene como objetivo generar una secuencia de proteínas relevante basada en memoria a largo y corto plazo bidireccional (LSTM) con conocimiento parcial de las interacciones. El marco general comprende realizar un análisis de red compleja libre de escala y fractal. El resultado de estos análisis se utiliza para ajustar el método fractal para la extracción vital de proteínas de redes PPI. Los resultados muestran que varias redes PPI son auto-similares o fractales, pero que ambas características no pueden coexistir. Las secuencias de proteínas generadas (por el LSTM bidireccional) también contienen un promedio del 39.5% de proteínas en la secuencia original. La longitud promedio de las secuencias generadas fue del 17% de la original. Finalmente, el 95% de las secuencias generadas fueron verdaderas.

Otros recursos que podrían interesarte

Temas Virtualpro