Estudio de Asociación del Genoma Completo Basado en Genes Identificó Genes para Rasgos Agronómicos en Maíz
Autores: Zhao, Yunfeng; Gao, Jin; Guo, Xiugang; Su, Baofeng; Wang, Haijie; Yang, Runqing; Jiang, Li
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Estudio de Asociación del Genoma Completo Basado en Genes Identificó Genes para Rasgos Agronómicos en Maíz
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Gen
SNP
GWAS
Maíz
Asociación
Rasgos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
Un gen integra los efectos de todos los SNP en su secuencia, lo que beneficia el estudio de asociación a nivel genómico. Para explorar las variaciones a nivel de gen que afectan los rasgos económicos en el maíz, ampliamos el software de análisis GWAS basado en SNP, Single-RunKing, desarrollado por nuestro equipo, a GWAS basado en genes, que utilizó el algoritmo FaST-LMM para convertir el modelo lineal mixto en un análisis de asociación de modelo lineal simple. Se formuló una estadística de prueba F para probar e identificar genes candidatos. Comparamos la eficiencia estadística de usar el 80% de componentes principales (EPC), el primer componente principal (FPC) y todos los marcadores SNP (ALLSNP) como variables independientes, que los predecesores comúnmente usaban para integrar SNP y representar genes. Con un conjunto de datos genómicos de la Universidad Agrícola de Huazhong (HAU) de 2.65M SNP de 540 plantas de maíz, se anotaron 34,774 genes en todo el genoma. Se realizaron estudios de asociación a nivel genómico con 20 rasgos agronómicos utilizando el software desarrollado aquí. También se analizó otro conjunto de datos de maíz del panel de Ames (AP). El método EPC se ajusta bien al modelo y tiene buena eficiencia estadística. No solo supera el problema de falsos negativos al usar todos los marcadores SNP para el análisis (ALLSNP), sino que también resuelve el problema de falsos positivos de su correspondiente método de modelo lineal simple EPCLM. En comparación con FPC, el método EPC tiene una mayor eficiencia estadística. Se identificaron un total de 132 genes de rasgos cuantitativos (QTG) para los 20 rasgos del conjunto de datos de maíz HAU y un rasgo del maíz AP.
Descripción
Un gen integra los efectos de todos los SNP en su secuencia, lo que beneficia el estudio de asociación a nivel genómico. Para explorar las variaciones a nivel de gen que afectan los rasgos económicos en el maíz, ampliamos el software de análisis GWAS basado en SNP, Single-RunKing, desarrollado por nuestro equipo, a GWAS basado en genes, que utilizó el algoritmo FaST-LMM para convertir el modelo lineal mixto en un análisis de asociación de modelo lineal simple. Se formuló una estadística de prueba F para probar e identificar genes candidatos. Comparamos la eficiencia estadística de usar el 80% de componentes principales (EPC), el primer componente principal (FPC) y todos los marcadores SNP (ALLSNP) como variables independientes, que los predecesores comúnmente usaban para integrar SNP y representar genes. Con un conjunto de datos genómicos de la Universidad Agrícola de Huazhong (HAU) de 2.65M SNP de 540 plantas de maíz, se anotaron 34,774 genes en todo el genoma. Se realizaron estudios de asociación a nivel genómico con 20 rasgos agronómicos utilizando el software desarrollado aquí. También se analizó otro conjunto de datos de maíz del panel de Ames (AP). El método EPC se ajusta bien al modelo y tiene buena eficiencia estadística. No solo supera el problema de falsos negativos al usar todos los marcadores SNP para el análisis (ALLSNP), sino que también resuelve el problema de falsos positivos de su correspondiente método de modelo lineal simple EPCLM. En comparación con FPC, el método EPC tiene una mayor eficiencia estadística. Se identificaron un total de 132 genes de rasgos cuantitativos (QTG) para los 20 rasgos del conjunto de datos de maíz HAU y un rasgo del maíz AP.