Evaluación de ensamblajes genómicos para la optimización de la completitud y precisión de las secuencias de genes de referencia en trigo, centeno y triticale
Autores: Yan, Mingke; Yang, Guodong; Yang, Dongming; Zhang, Xin; Wang, Quanzhen; Gao, Jinghui; Mei, Chugang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Evaluación de ensamblajes genómicos para la optimización de la completitud y precisión de las secuencias de genes de referencia en trigo, centeno y triticale
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Ensamblajes de genomas
Cultivos de Triticeae
Investigación relacionada con genes
Trigo
Centeno
Triticale
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 9
Citaciones: Sin citaciones
En los últimos años, hemos sido testigos de un aumento en la publicación de docenas de ensamblajes genómicos para cultivos de Triticeae, lo que ha avanzado significativamente la investigación relacionada con los genes en trigo, centeno y triticale. Sin embargo, este progreso también ha introducido desafíos en la selección de genomas de referencia universalmente eficientes y aplicables para genotipos con relaciones filogenéticas distantes o ambiguas. En este estudio, evaluamos la completitud y precisión de los ensamblajes genómicos para trigo, centeno y triticale utilizando análisis de referencia comparativa de ortólogos de copia única universal (BUSCO) y enfoques de mapeo de transcriptos. El análisis de BUSCO reveló que la proporción de genes completos se correlacionó positivamente con la capacidad de mapeo de lecturas de RNA-seq, mientras que la frecuencia de codones de parada internos sirvió como un indicador negativo significativo de la precisión del ensamblaje y la capacidad de mapeo de datos de RNA-seq en trigo. A través de un análisis integrado de la tasa de alineación, la longitud cubierta y la profundidad total de los datos de RNA-seq, identificamos los ensamblajes de SY Mattis, Lo7 y SY Mattis más Lo7 como las referencias más robustas para estudios relacionados con genes en trigo, centeno y triticale, respectivamente. Además, recomendamos que la secuencia del genoma D se incorpore en los ensamblajes de referencia en análisis bioinformáticos para triticale, ya que la introgressión, translocación y sustitución del genoma D en el genoma de triticale ocurre con frecuencia durante la crianza de triticale. La frecuencia de codones de parada internos podría ayudar a evaluar la corrección de los ensamblajes publicados en el futuro, y se espera que otros hallazgos apoyen la investigación relacionada con genes en trigo, centeno, triticale y otras especies estrechamente relacionadas.
Descripción
En los últimos años, hemos sido testigos de un aumento en la publicación de docenas de ensamblajes genómicos para cultivos de Triticeae, lo que ha avanzado significativamente la investigación relacionada con los genes en trigo, centeno y triticale. Sin embargo, este progreso también ha introducido desafíos en la selección de genomas de referencia universalmente eficientes y aplicables para genotipos con relaciones filogenéticas distantes o ambiguas. En este estudio, evaluamos la completitud y precisión de los ensamblajes genómicos para trigo, centeno y triticale utilizando análisis de referencia comparativa de ortólogos de copia única universal (BUSCO) y enfoques de mapeo de transcriptos. El análisis de BUSCO reveló que la proporción de genes completos se correlacionó positivamente con la capacidad de mapeo de lecturas de RNA-seq, mientras que la frecuencia de codones de parada internos sirvió como un indicador negativo significativo de la precisión del ensamblaje y la capacidad de mapeo de datos de RNA-seq en trigo. A través de un análisis integrado de la tasa de alineación, la longitud cubierta y la profundidad total de los datos de RNA-seq, identificamos los ensamblajes de SY Mattis, Lo7 y SY Mattis más Lo7 como las referencias más robustas para estudios relacionados con genes en trigo, centeno y triticale, respectivamente. Además, recomendamos que la secuencia del genoma D se incorpore en los ensamblajes de referencia en análisis bioinformáticos para triticale, ya que la introgressión, translocación y sustitución del genoma D en el genoma de triticale ocurre con frecuencia durante la crianza de triticale. La frecuencia de codones de parada internos podría ayudar a evaluar la corrección de los ensamblajes publicados en el futuro, y se espera que otros hallazgos apoyen la investigación relacionada con genes en trigo, centeno, triticale y otras especies estrechamente relacionadas.