Identificación de Interacciones Proteicas Relevantes con Conocimiento Parcial: Un Enfoque de Red Compleja y Aprendizaje Profundo
Autores: Ortiz-Vilchis, Pilar; De-la-Cruz-García, Jazmin-Susana; Ramirez-Arellano, Aldo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Identificación de Interacciones Proteicas Relevantes con Conocimiento Parcial: Un Enfoque de Red Compleja y Aprendizaje Profundo
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Interacciones proteína-proteína
Aprendizaje automático
Análisis de redes
LSTM
Método fractal
Redes PPI
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Las interacciones proteína-proteína (PPIs) son la base para entender la mayoría de los eventos celulares en los sistemas biológicos. Se han utilizado varios métodos experimentales, como métodos bioquímicos, moleculares y genéticos, para identificar asociaciones proteína-proteína. Sin embargo, algunos de ellos, como la espectrometría de masas, son lentos y costosos. Las técnicas de aprendizaje automático (ML) se han utilizado ampliamente para caracterizar las PPIs, aumentando el número de proteínas analizadas simultáneamente y optimizando el tiempo y los recursos para identificar y predecir los vínculos funcionales entre proteínas. Los enfoques anteriores de ML se han centrado en redes bien conocidas o en objetivos específicos, pero no en identificar proteínas relevantes con conocimiento parcial o nulo de las redes de interacción. El enfoque propuesto tiene como objetivo generar una secuencia de proteínas relevante basada en memoria a largo y corto plazo bidireccional (LSTM) con conocimiento parcial de las interacciones. El marco general comprende realizar un análisis de red compleja libre de escala y fractal. El resultado de estos análisis se utiliza para ajustar el método fractal para la extracción vital de proteínas de redes PPI. Los resultados muestran que varias redes PPI son auto-similares o fractales, pero que ambas características no pueden coexistir. Las secuencias de proteínas generadas (por el LSTM bidireccional) también contienen un promedio del 39.5% de proteínas en la secuencia original. La longitud promedio de las secuencias generadas fue del 17% de la original. Finalmente, el 95% de las secuencias generadas fueron verdaderas.
Descripción
Las interacciones proteína-proteína (PPIs) son la base para entender la mayoría de los eventos celulares en los sistemas biológicos. Se han utilizado varios métodos experimentales, como métodos bioquímicos, moleculares y genéticos, para identificar asociaciones proteína-proteína. Sin embargo, algunos de ellos, como la espectrometría de masas, son lentos y costosos. Las técnicas de aprendizaje automático (ML) se han utilizado ampliamente para caracterizar las PPIs, aumentando el número de proteínas analizadas simultáneamente y optimizando el tiempo y los recursos para identificar y predecir los vínculos funcionales entre proteínas. Los enfoques anteriores de ML se han centrado en redes bien conocidas o en objetivos específicos, pero no en identificar proteínas relevantes con conocimiento parcial o nulo de las redes de interacción. El enfoque propuesto tiene como objetivo generar una secuencia de proteínas relevante basada en memoria a largo y corto plazo bidireccional (LSTM) con conocimiento parcial de las interacciones. El marco general comprende realizar un análisis de red compleja libre de escala y fractal. El resultado de estos análisis se utiliza para ajustar el método fractal para la extracción vital de proteínas de redes PPI. Los resultados muestran que varias redes PPI son auto-similares o fractales, pero que ambas características no pueden coexistir. Las secuencias de proteínas generadas (por el LSTM bidireccional) también contienen un promedio del 39.5% de proteínas en la secuencia original. La longitud promedio de las secuencias generadas fue del 17% de la original. Finalmente, el 95% de las secuencias generadas fueron verdaderas.