logo móvil
Contáctanos

El Aprendizaje por Transferencia Permite una Predicción Precisa de Sitios de Objetivo de RBP con Tamaños de Muestra Limitados

Autores: Vaculík, Ondej; Chalupová, Elika; Greová, Katarína; Majtner, Tomá; Alexiou, Panagiotis

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

El Aprendizaje por Transferencia Permite una Predicción Precisa de Sitios de Objetivo de RBP con Tamaños de Muestra Limitados


Categoría

Ciencias Naturales y Subdisciplinas

Subcategoría

Biología

Palabras clave

Proteínas que se unen al ARN
Procesos biológicos
Aprendizaje profundo
Interacciones proteína-ARN
Aprendizaje por transferencia
Sitios de unión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 19

Citaciones: Sin citaciones


Descripción
Las proteínas que se unen al ARN son reguladores vitales en numerosos procesos biológicos. Su disfunción puede resultar en diversas enfermedades, como el cáncer o trastornos neurodegenerativos, lo que hace que la predicción de sus sitios de unión sea de alta importancia. El aprendizaje profundo (DL) ha traído una revolución en varios dominios biológicos, incluido el campo de las interacciones proteína-ARN. No obstante, persisten varios desafíos, como la disponibilidad limitada de sitios de unión validados experimentalmente para entrenar modelos de DL de alto rendimiento para la mayoría de las proteínas. Aquí, presentamos un nuevo enfoque de entrenamiento basado en el aprendizaje por transferencia (TL) para abordar el problema de los datos limitados. Empleando una arquitectura sofisticada e interpretable, comparamos el rendimiento de nuestro método entrenado utilizando dos enfoques distintos: entrenamiento desde cero (SCR) y utilización de TL. Además, evaluamos nuestros resultados en comparación con los métodos más avanzados actuales. Además, abordamos los desafíos asociados con la selección de características de entrada apropiadas y la determinación de tamaños de intervalo óptimos. Nuestros resultados muestran que TL mejora el rendimiento del modelo, particularmente en conjuntos de datos con datos de entrenamiento mínimos, donde se pueden lograr resultados satisfactorios con solo unos pocos cientos de sitios de unión al ARN. Además, demostramos que la integración de información tanto de secuencia como de conservación evolutiva conduce a un rendimiento superior. Adicionalmente, mostramos cómo la incorporación de una capa de atención en el modelo facilita la interpretación de las predicciones dentro de un contexto biológicamente relevante.

Otros recursos que podrían interesarte

Temas Virtualpro