En Verificación In Silico de Secuencias de Promotores Potenciales Predichas en el Genoma del Arroz ()
Autores: Bubnova, Anastasiya N.; Yakovleva, Irina V.; Korotkov, Eugene V.; Kamionskaya, Anastasiya M.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
En Verificación In Silico de Secuencias de Promotores Potenciales Predichas en el Genoma del Arroz ()
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Secuencias de promotores
Resultados falsos positivos
Motivos TATA
Elementos cis-regulatorios
Sitios de inicio de transcripción
Accesibilidad de la cromatina
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 11
Citaciones: Sin citaciones
La identificación exacta de las secuencias promotoras sigue siendo un problema serio en la biología computacional, ya que los algoritmos de predicción de promotores en desarrollo continúan produciendo resultados falsos positivos. Por lo tanto, para evaluar completamente la validez de las secuencias predichas, es necesario realizar una prueba exhaustiva de sus propiedades, como la presencia de regiones de ADN transcritas aguas abajo de ellas, o la accesibilidad de la cromatina para la unión de factores de transcripción. En este trabajo, examinamos las secuencias promotoras del cromosoma 1 del genoma de arroz de la Base de Datos de Secuencias Promotoras Potenciales predichas utilizando un algoritmo matemático basado en la derivación y el cálculo de clases de promotores estadísticamente significativas. En este trabajo se identificaron motivos TATA y elementos cis-regulatorios en las secuencias promotoras predichas. También verificamos la presencia de posibles sitios de inicio de transcripción cerca de los promotores predichos al analizar datos de CAGE-seq. Buscamos transcritos no anotados detrás de las secuencias predichas al ensamblar de novo transcritos a partir de datos de RNA-seq. También examinamos la accesibilidad de la cromatina en la región de los promotores predichos al analizar datos de ATAC-seq. Como resultado de este trabajo, identificamos las secuencias predichas que son más propensas a ser promotores para una validación experimental adicional en un sistema in vivo o in vitro.
Descripción
La identificación exacta de las secuencias promotoras sigue siendo un problema serio en la biología computacional, ya que los algoritmos de predicción de promotores en desarrollo continúan produciendo resultados falsos positivos. Por lo tanto, para evaluar completamente la validez de las secuencias predichas, es necesario realizar una prueba exhaustiva de sus propiedades, como la presencia de regiones de ADN transcritas aguas abajo de ellas, o la accesibilidad de la cromatina para la unión de factores de transcripción. En este trabajo, examinamos las secuencias promotoras del cromosoma 1 del genoma de arroz de la Base de Datos de Secuencias Promotoras Potenciales predichas utilizando un algoritmo matemático basado en la derivación y el cálculo de clases de promotores estadísticamente significativas. En este trabajo se identificaron motivos TATA y elementos cis-regulatorios en las secuencias promotoras predichas. También verificamos la presencia de posibles sitios de inicio de transcripción cerca de los promotores predichos al analizar datos de CAGE-seq. Buscamos transcritos no anotados detrás de las secuencias predichas al ensamblar de novo transcritos a partir de datos de RNA-seq. También examinamos la accesibilidad de la cromatina en la región de los promotores predichos al analizar datos de ATAC-seq. Como resultado de este trabajo, identificamos las secuencias predichas que son más propensas a ser promotores para una validación experimental adicional en un sistema in vivo o in vitro.