Un nuevo predictor para el análisis y la predicción de potenciadores y su fuerza a través de características de múltiples vistas y un bosque profundo
Autores: Gill, Mehwish; Ahmed, Saeed; Kabir, Muhammad; Hayat, Maqsood
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un nuevo predictor para el análisis y la predicción de potenciadores y su fuerza a través de características de múltiples vistas y un bosque profundo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Potenciadores
Factores de transcripción
Trastornos humanos
Biología computacional
Descubrimiento de fármacos
Enfoques basados en aprendizaje profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los potenciadores son segmentos cortos de ADN (50-1500 pb) que activan eficazmente la transcripción génica cuando están presentes factores de transcripción (TFs). Existe una correlación entre las diferencias genéticas en los potenciadores y numerosos trastornos humanos, incluidos el cáncer y la enfermedad inflamatoria intestinal. En biología computacional, la categorización precisa de los potenciadores puede proporcionar información importante para el descubrimiento y desarrollo de fármacos. Se considera que los enfoques experimentales de alto rendimiento son herramientas vitales para investigar las características clave de los potenciadores; sin embargo, debido a que estas técnicas requieren mucho trabajo y tiempo, puede ser difícil para los investigadores predecir los potenciadores y sus capacidades. Por lo tanto, se consideran técnicas computacionales como una estrategia alternativa para abordar este problema. Según los tipos de algoritmos que se han utilizado para construir predictores, las metodologías actuales se pueden dividir en tres categorías principales: métodos basados en conjuntos, enfoques basados en aprendizaje profundo y técnicas tradicionales de ML. En este estudio, desarrollamos un nuevo predictor basado en un bosque profundo de dos capas para la predicción precisa de potenciadores y su fuerza, a saber, NEPERS. Los potenciadores y no potenciadores se dividen en el primer nivel por NEPERS, mientras que los potenciadores fuertes y débiles se dividen en el segundo nivel. Para evaluar la efectividad de la fusión de características, se combinaron bosques profundos por bloques y otros algoritmos con características de múltiples vistas como PSTNPss, PSTNPdss, CKSNAP y NCP a través de validación cruzada de 10 pliegues y pruebas independientes. Nuestra técnica propuesta supera a los modelos competidores en todos los parámetros, con un ACC de 0.876, Sen de 0.864, Spe de 0.888, MCC de 0.753 y AUC de 0.940 para la capa 1 y un ACC de 0.959, Sen de 0.960, Spe de 0.958, MCC de 0.918 y AUC de 0.990 para la capa 2, respectivamente, para el conjunto de datos de referencia. De manera similar, para la prueba independiente, el ACC, Sen, Spe, MCC y AUC fueron 0.863, 0.865, 0.860, 0.725 y 0.948 para la capa 1 y 0.890, 0.940, 0.840, 0.784 y 0.951 para la capa 2, respectivamente. Este estudio proporciona información concluyente para la detección y caracterización precisa y efectiva de los potenciadores y sus fuerzas.
Descripción
Los potenciadores son segmentos cortos de ADN (50-1500 pb) que activan eficazmente la transcripción génica cuando están presentes factores de transcripción (TFs). Existe una correlación entre las diferencias genéticas en los potenciadores y numerosos trastornos humanos, incluidos el cáncer y la enfermedad inflamatoria intestinal. En biología computacional, la categorización precisa de los potenciadores puede proporcionar información importante para el descubrimiento y desarrollo de fármacos. Se considera que los enfoques experimentales de alto rendimiento son herramientas vitales para investigar las características clave de los potenciadores; sin embargo, debido a que estas técnicas requieren mucho trabajo y tiempo, puede ser difícil para los investigadores predecir los potenciadores y sus capacidades. Por lo tanto, se consideran técnicas computacionales como una estrategia alternativa para abordar este problema. Según los tipos de algoritmos que se han utilizado para construir predictores, las metodologías actuales se pueden dividir en tres categorías principales: métodos basados en conjuntos, enfoques basados en aprendizaje profundo y técnicas tradicionales de ML. En este estudio, desarrollamos un nuevo predictor basado en un bosque profundo de dos capas para la predicción precisa de potenciadores y su fuerza, a saber, NEPERS. Los potenciadores y no potenciadores se dividen en el primer nivel por NEPERS, mientras que los potenciadores fuertes y débiles se dividen en el segundo nivel. Para evaluar la efectividad de la fusión de características, se combinaron bosques profundos por bloques y otros algoritmos con características de múltiples vistas como PSTNPss, PSTNPdss, CKSNAP y NCP a través de validación cruzada de 10 pliegues y pruebas independientes. Nuestra técnica propuesta supera a los modelos competidores en todos los parámetros, con un ACC de 0.876, Sen de 0.864, Spe de 0.888, MCC de 0.753 y AUC de 0.940 para la capa 1 y un ACC de 0.959, Sen de 0.960, Spe de 0.958, MCC de 0.918 y AUC de 0.990 para la capa 2, respectivamente, para el conjunto de datos de referencia. De manera similar, para la prueba independiente, el ACC, Sen, Spe, MCC y AUC fueron 0.863, 0.865, 0.860, 0.725 y 0.948 para la capa 1 y 0.890, 0.940, 0.840, 0.784 y 0.951 para la capa 2, respectivamente. Este estudio proporciona información concluyente para la detección y caracterización precisa y efectiva de los potenciadores y sus fuerzas.