Hgatgs: red de atención de hipergrafo para la selección genómica de cultivos
Autores: He, Xuliang; Wang, Kaiyi; Zhang, Liyang; Zhang, Dongfeng; Yang, Feng; Zhang, Qiusi; Pan, Shouhui; Li, Jinlong; Bai, Longpeng; Sun, Jiahao; Liu, Zhongqiang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Hgatgs: red de atención de hipergrafo para la selección genómica de cultivos
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Importante
Selección genómica
Redes de atención de hipergráficos
Selección de genoma de cultivos
Variación genética
Predicción fenotípica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Muchas de las características agronómicas importantes de las plantas, como el rendimiento de los cultivos, la tolerancia al estrés y otras características, están controladas por múltiples genes y presentan patrones de herencia complejos. Los métodos tradicionales de cría a menudo encuentran dificultades para tratar con estas características debido a su complejidad. Sin embargo, la selección genómica (GS), que utiliza marcadores moleculares de alta densidad en todo el genoma para facilitar la selección en programas de cría, sobresale en capturar la variación genética asociada con estas características. Esto permite una selección más precisa y eficiente en la cría. El modelo tradicional de selección genómica de cultivos, basado en métodos estadísticos o modelos de aprendizaje automático, a menudo trata las muestras como entidades independientes, descuidando la abundante información relacional latente entre ellas. En consecuencia, esta limitación obstaculiza su rendimiento predictivo. En este estudio, propusimos un nuevo modelo de selección genómica de cultivos basado en redes de atención de hipercubos para predicción genómica (HGATGS). Este modelo incorpora hipercubos dinámicos diseñados en función de la similitud de las muestras para validar la eficacia de las relaciones de alto orden entre muestras para la predicción fenotípica. Al introducir un mecanismo de atención, asigna pesos a diferentes hipercubos y nodos, mejorando así la capacidad de capturar relaciones de parentesco entre muestras. Además, se incorporan conexiones residuales entre capas convolucionales de hipercubos para mejorar aún más la estabilidad y el rendimiento del modelo. El modelo se validó en conjuntos de datos para múltiples cultivos, incluido trigo, maíz y arroz. Los resultados mostraron que HGATGS superó significativamente a los métodos estadísticos tradicionales y a los modelos de aprendizaje automático en los conjuntos de datos Wheat 599, Rice 299 y G2F 2017. En Wheat 599, HGATGS logró un coeficiente de correlación de 0,54, una mejora del 14,9% respecto a métodos como R-BLUP y BayesA (0,47). En Rice 299, HGATGS alcanzó 0,45, un aumento del 66,7% en comparación con otros modelos como R-BLUP y SVR (0,27). En G2F 2017, HGATGS obtuvo 0,88, superando ligeramente a otros modelos como R-BLUP y BayesA (0,87). Realizamos experimentos de abstracción para comparar el rendimiento del modelo en los tres conjuntos de datos, y encontramos que el modelo que integra la atención de hipercubos y las conexiones residuales funcionó de manera óptima. Las comparaciones posteriores del rendimiento de predicción del modelo con diferentes valores de k seleccionados dinámicamente revelaron un rendimiento óptimo cuando K = (3,4). El rendimiento de predicción del modelo también se comparó en diferentes polimorfismos de un solo nucleótido (SNP) y tamaños de muestra en varios conjuntos de datos, con HGATGS superando consistentemente a los modelos de comparación. Finalmente, las visualizaciones de las estructuras de hipercubos construidas mostraron que ciertos nodos tienen altas densidades de conexión con hipercubos. Estos nodos a menudo representan variedades o genotipos con impactos significativos en las características. Durante la agregación de características, estos nodos de alta conectividad contribuyen significativamente a los resultados de predicción y demuestran un mejor rendimiento de predicción en múltiples características en varios cultivos. Esto demuestra que el método de construcción de hipercubos a través de relaciones de correlación para la predicción es altamente efectivo.
Descripción
Muchas de las características agronómicas importantes de las plantas, como el rendimiento de los cultivos, la tolerancia al estrés y otras características, están controladas por múltiples genes y presentan patrones de herencia complejos. Los métodos tradicionales de cría a menudo encuentran dificultades para tratar con estas características debido a su complejidad. Sin embargo, la selección genómica (GS), que utiliza marcadores moleculares de alta densidad en todo el genoma para facilitar la selección en programas de cría, sobresale en capturar la variación genética asociada con estas características. Esto permite una selección más precisa y eficiente en la cría. El modelo tradicional de selección genómica de cultivos, basado en métodos estadísticos o modelos de aprendizaje automático, a menudo trata las muestras como entidades independientes, descuidando la abundante información relacional latente entre ellas. En consecuencia, esta limitación obstaculiza su rendimiento predictivo. En este estudio, propusimos un nuevo modelo de selección genómica de cultivos basado en redes de atención de hipercubos para predicción genómica (HGATGS). Este modelo incorpora hipercubos dinámicos diseñados en función de la similitud de las muestras para validar la eficacia de las relaciones de alto orden entre muestras para la predicción fenotípica. Al introducir un mecanismo de atención, asigna pesos a diferentes hipercubos y nodos, mejorando así la capacidad de capturar relaciones de parentesco entre muestras. Además, se incorporan conexiones residuales entre capas convolucionales de hipercubos para mejorar aún más la estabilidad y el rendimiento del modelo. El modelo se validó en conjuntos de datos para múltiples cultivos, incluido trigo, maíz y arroz. Los resultados mostraron que HGATGS superó significativamente a los métodos estadísticos tradicionales y a los modelos de aprendizaje automático en los conjuntos de datos Wheat 599, Rice 299 y G2F 2017. En Wheat 599, HGATGS logró un coeficiente de correlación de 0,54, una mejora del 14,9% respecto a métodos como R-BLUP y BayesA (0,47). En Rice 299, HGATGS alcanzó 0,45, un aumento del 66,7% en comparación con otros modelos como R-BLUP y SVR (0,27). En G2F 2017, HGATGS obtuvo 0,88, superando ligeramente a otros modelos como R-BLUP y BayesA (0,87). Realizamos experimentos de abstracción para comparar el rendimiento del modelo en los tres conjuntos de datos, y encontramos que el modelo que integra la atención de hipercubos y las conexiones residuales funcionó de manera óptima. Las comparaciones posteriores del rendimiento de predicción del modelo con diferentes valores de k seleccionados dinámicamente revelaron un rendimiento óptimo cuando K = (3,4). El rendimiento de predicción del modelo también se comparó en diferentes polimorfismos de un solo nucleótido (SNP) y tamaños de muestra en varios conjuntos de datos, con HGATGS superando consistentemente a los modelos de comparación. Finalmente, las visualizaciones de las estructuras de hipercubos construidas mostraron que ciertos nodos tienen altas densidades de conexión con hipercubos. Estos nodos a menudo representan variedades o genotipos con impactos significativos en las características. Durante la agregación de características, estos nodos de alta conectividad contribuyen significativamente a los resultados de predicción y demuestran un mejor rendimiento de predicción en múltiples características en varios cultivos. Esto demuestra que el método de construcción de hipercubos a través de relaciones de correlación para la predicción es altamente efectivo.