Ensamblaje a Nivel de Cromosoma del Genoma de Lino Impulsado por Datos de Nanoporos
Autores: Arkhipov, Alexander A.; Pushkova, Elena N.; Bolsheva, Nadezhda L.; Rozhmina, Tatiana A.; Borkhert, Elena V.; Zhernova, Daiana A.; Rybakova, Tatiana Yu.; Barsukov, Nikolai M.; Moskalenko, Olesya D.; Sigova, Elizaveta A.; Dvorianinova, Ekaterina M.; Melnikova, Nataliya V.; Dmitriev, Alexey A.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Ensamblaje a Nivel de Cromosoma del Genoma de Lino Impulsado por Datos de Nanoporos
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Linaza
Genoma
Ensamblaje
Cromosomas
Secuenciación
Telomérico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 9
Citaciones: Sin citaciones
El lino es un cultivo importante que se cultiva por sus semillas y fibra. El número de cromosomas del lino es 2n = 30, y su tamaño genómico es de aproximadamente 450-480 Mb. Hasta la fecha, se han secuenciado y ensamblado los genomas de varias variedades de lino. Sin embargo, los ensamblajes obtenidos aún están lejos del nivel telómero a telómero (T2T). Secuenciamos el genoma de la variedad de lino K-3018 en la plataforma de Oxford Nanopore Technologies (ONT) y obtuvimos 57.7 Gb de lecturas simples R10 con un N50 = 18.4 kb (~120x de cobertura del genoma). Las lecturas de ONT de más de 50 kb se mantuvieron como ultra-largas (~10x de cobertura del genoma), y el resto de las lecturas de ONT se corrigieron utilizando el modelo HERRO R10 (calidad > Q10, longitud > 10 kb, ~60x de cobertura del genoma restante). El genoma se ensambló utilizando Hifiasm y Verkko. El ensamblaje generado por Hifiasm tenía una longitud de 489.1 Mb con 54 contigs y un N50 = 28.1 Mb. Verkko produjo un genoma muy similar pero más fragmentado: 489.1 Mb, 134 contigs, N50 = 17.4 Mb. En el ensamblaje por Hifiasm, ocho cromosomas consistían en un solo contig con repeticiones teloméricas en ambos extremos. Además, cinco cromosomas comprendían dos contigs y dos cromosomas comprendían tres contigs. Estos cromosomas también tenían repeticiones teloméricas en sus extremos. El ensamblaje generado por Hifiasm de la variedad K-3018 tenía una contigüidad similar pero probablemente era más completo y preciso que el ensamblaje principal de quince cromosomas de la variedad YY5 (producido a partir de datos de PacBio y estructurado con datos de Hi-C), el ensamblaje de genoma de lino más contiguo en el momento de escribir esto. Sugerimos que una cobertura genómica suficiente con largas lecturas simples R10 de ONT es una alternativa viable a los datos de PacBio más Hi-C para un ensamblaje de genoma T2T de alta precisión del lino, abriendo nuevas perspectivas para estudios de genoma completo del lino.
Descripción
El lino es un cultivo importante que se cultiva por sus semillas y fibra. El número de cromosomas del lino es 2n = 30, y su tamaño genómico es de aproximadamente 450-480 Mb. Hasta la fecha, se han secuenciado y ensamblado los genomas de varias variedades de lino. Sin embargo, los ensamblajes obtenidos aún están lejos del nivel telómero a telómero (T2T). Secuenciamos el genoma de la variedad de lino K-3018 en la plataforma de Oxford Nanopore Technologies (ONT) y obtuvimos 57.7 Gb de lecturas simples R10 con un N50 = 18.4 kb (~120x de cobertura del genoma). Las lecturas de ONT de más de 50 kb se mantuvieron como ultra-largas (~10x de cobertura del genoma), y el resto de las lecturas de ONT se corrigieron utilizando el modelo HERRO R10 (calidad > Q10, longitud > 10 kb, ~60x de cobertura del genoma restante). El genoma se ensambló utilizando Hifiasm y Verkko. El ensamblaje generado por Hifiasm tenía una longitud de 489.1 Mb con 54 contigs y un N50 = 28.1 Mb. Verkko produjo un genoma muy similar pero más fragmentado: 489.1 Mb, 134 contigs, N50 = 17.4 Mb. En el ensamblaje por Hifiasm, ocho cromosomas consistían en un solo contig con repeticiones teloméricas en ambos extremos. Además, cinco cromosomas comprendían dos contigs y dos cromosomas comprendían tres contigs. Estos cromosomas también tenían repeticiones teloméricas en sus extremos. El ensamblaje generado por Hifiasm de la variedad K-3018 tenía una contigüidad similar pero probablemente era más completo y preciso que el ensamblaje principal de quince cromosomas de la variedad YY5 (producido a partir de datos de PacBio y estructurado con datos de Hi-C), el ensamblaje de genoma de lino más contiguo en el momento de escribir esto. Sugerimos que una cobertura genómica suficiente con largas lecturas simples R10 de ONT es una alternativa viable a los datos de PacBio más Hi-C para un ensamblaje de genoma T2T de alta precisión del lino, abriendo nuevas perspectivas para estudios de genoma completo del lino.