Ensamblaje del genoma y análisis de variación estructural proporcionan información sobre el tiempo de floración y el desarrollo de crestas
Autores: Huang, Aizheng; Feng, Shuo; Ye, Zhuole; Zhang, Ting; Chen, Shenglong; Chen, Changming; Chen, Shijun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Ensamblaje del genoma y análisis de variación estructural proporcionan información sobre el tiempo de floración y el desarrollo de crestas
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Vegetal
Planta medicinal
Genoma
PacBio
Secuencias repetitivas
Análisis filogenético
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 9
Citaciones: Sin citaciones
spp. es un importante vegetal cultivado y planta medicinal a nivel mundial de la familia Cucurbitaceae. En este estudio, informamos sobre un genoma de alta calidad a nivel de cromosoma de la línea inbred de alta generación SG261. La secuencia genómica fue determinada por lecturas largas de PacBio, lecturas de secuenciación Hi-C y secuenciación de 10x Genomics, con un tamaño de ensamblaje de 739.82 Mb, un N50 de contig de 18.38 Mb y un N50 de andamiaje de 56.08 Mb. Se predijo que el genoma contenía 27,312 genes codificadores de proteínas y un 72.56% de secuencias repetitivas, de las cuales los repeticiones terminales largas (LTRs) eran una forma importante de secuencias repetitivas, representando el 67.84% del genoma. El análisis filogenético revela que evolucionó más tarde que , y está estrechamente relacionado con . Comparando el genoma de y con datos de PacBio, se identificaron 67,128 variaciones estructurales de alta calidad (SVs) y 55,978 variaciones de presencia-ausencia (PAVs) en , resultando en 2424 y 1094 genes con variación en la región CDS, respectivamente, y hay 287 genes idénticos afectados por dos análisis diferentes de variación estructural. Además, encontramos que las familias de factores de transcripción FY () tuvieron una gran expansión en (floración por la mañana) en comparación con (floración por la tarde), lo que puede resultar en el tiempo de floración temprana en . Este estudio proporciona una referencia valiosa para la cría de y la investigación del pan-genoma en especies.
Descripción
spp. es un importante vegetal cultivado y planta medicinal a nivel mundial de la familia Cucurbitaceae. En este estudio, informamos sobre un genoma de alta calidad a nivel de cromosoma de la línea inbred de alta generación SG261. La secuencia genómica fue determinada por lecturas largas de PacBio, lecturas de secuenciación Hi-C y secuenciación de 10x Genomics, con un tamaño de ensamblaje de 739.82 Mb, un N50 de contig de 18.38 Mb y un N50 de andamiaje de 56.08 Mb. Se predijo que el genoma contenía 27,312 genes codificadores de proteínas y un 72.56% de secuencias repetitivas, de las cuales los repeticiones terminales largas (LTRs) eran una forma importante de secuencias repetitivas, representando el 67.84% del genoma. El análisis filogenético revela que evolucionó más tarde que , y está estrechamente relacionado con . Comparando el genoma de y con datos de PacBio, se identificaron 67,128 variaciones estructurales de alta calidad (SVs) y 55,978 variaciones de presencia-ausencia (PAVs) en , resultando en 2424 y 1094 genes con variación en la región CDS, respectivamente, y hay 287 genes idénticos afectados por dos análisis diferentes de variación estructural. Además, encontramos que las familias de factores de transcripción FY () tuvieron una gran expansión en (floración por la mañana) en comparación con (floración por la tarde), lo que puede resultar en el tiempo de floración temprana en . Este estudio proporciona una referencia valiosa para la cría de y la investigación del pan-genoma en especies.