Btfbs: predicción de unión de factores de transcripción bacterianos y sitios de unión basados en aprendizaje profundo
Autores: Jin, Bingbing; Liang, Song; Liu, Xiaoqian; Zhang, Rui; Zhu, Yun; Chen, Yuanyuan; Liu, Guangjin; Yang, Tao
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Btfbs: predicción de unión de factores de transcripción bacterianos y sitios de unión basados en aprendizaje profundo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Factores de transcripción
Sitios de unión de FT
Aprendizaje automático
Aprendizaje profundo
Modelo BTFBS
Transcripción bacteriana
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
La unión de factores de transcripción (TFs) a sitios de unión de TF desempeña un papel vital en el proceso de regulación de la expresión génica y evolución. Con el desarrollo del aprendizaje automático y el aprendizaje profundo, se han logrado algunos éxitos en la predicción de factores de transcripción y sitios de unión. En este documento, desarrollamos un modelo, BTFBS, que predice si los factores de transcripción bacterianos y los sitios de unión se combinan o no. El modelo toma tanto las secuencias de aminoácidos de los factores de transcripción bacterianos como las secuencias de nucleótidos de los sitios de unión como entradas, y extrae características a través de una red neuronal convolucional y MultiheadAttention. Para las entradas del modelo, utilizamos dos métodos de muestreo de muestras negativas: RS y EE. En el conjunto de datos de prueba de RS, la precisión, sensibilidad, especificidad, puntaje F1 y MCC de BTFBS son 0.91446, 0.89746, 0.93134, 0.91264 y 0.82946, respectivamente. Además, en el conjunto de datos de prueba de EE, la precisión, sensibilidad, especificidad, puntaje F1 y MCC de BTFBS son 0.87868, 0.89354, 0.86394, 0.87996 y 0.75796, respectivamente. Mientras tanto, nuestros hallazgos indican que el enfoque óptimo para obtener muestras negativas en el contexto de la investigación bacteriana es utilizar las secuencias del genoma completo de las bacterias correspondientes, en lugar del método de mezclado. Los resultados anteriores en el conjunto de datos de prueba han demostrado que el modelo propuesto BTFBS tiene un buen rendimiento y puede proporcionar una guía experimental.
Descripción
La unión de factores de transcripción (TFs) a sitios de unión de TF desempeña un papel vital en el proceso de regulación de la expresión génica y evolución. Con el desarrollo del aprendizaje automático y el aprendizaje profundo, se han logrado algunos éxitos en la predicción de factores de transcripción y sitios de unión. En este documento, desarrollamos un modelo, BTFBS, que predice si los factores de transcripción bacterianos y los sitios de unión se combinan o no. El modelo toma tanto las secuencias de aminoácidos de los factores de transcripción bacterianos como las secuencias de nucleótidos de los sitios de unión como entradas, y extrae características a través de una red neuronal convolucional y MultiheadAttention. Para las entradas del modelo, utilizamos dos métodos de muestreo de muestras negativas: RS y EE. En el conjunto de datos de prueba de RS, la precisión, sensibilidad, especificidad, puntaje F1 y MCC de BTFBS son 0.91446, 0.89746, 0.93134, 0.91264 y 0.82946, respectivamente. Además, en el conjunto de datos de prueba de EE, la precisión, sensibilidad, especificidad, puntaje F1 y MCC de BTFBS son 0.87868, 0.89354, 0.86394, 0.87996 y 0.75796, respectivamente. Mientras tanto, nuestros hallazgos indican que el enfoque óptimo para obtener muestras negativas en el contexto de la investigación bacteriana es utilizar las secuencias del genoma completo de las bacterias correspondientes, en lugar del método de mezclado. Los resultados anteriores en el conjunto de datos de prueba han demostrado que el modelo propuesto BTFBS tiene un buen rendimiento y puede proporcionar una guía experimental.