DeepAT: un modelo de predicción de fenotipos de trigo basado en datos genotípicos de aprendizaje profundo
Autores: Li, Jiale; He, Zikang; Zhou, Guomin; Yan, Shen; Zhang, Jianhua
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
DeepAT: un modelo de predicción de fenotipos de trigo basado en datos genotípicos de aprendizaje profundo
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Selección genómica
Predicción de fenotipo
Aprendizaje profundo
DeepAT
Extracción de características
Relaciones genotipo-fenotipo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
La selección genómica sirve como una forma efectiva para la cría genética de cultivos, capaz de acortar significativamente el ciclo de cría y mejorar la precisión de la cría. La predicción del fenotipo puede ayudar a identificar variantes genéticas asociadas con fenotipos específicos. Esto proporciona un criterio de selección basado en datos para la selección genómica, lo que hace que el proceso de selección sea más eficiente y dirigido. El aprendizaje profundo se ha convertido en una herramienta importante para la predicción del fenotipo debido a sus habilidades en el aprendizaje automático de características, modelado no lineal y procesamiento de datos de alta dimensión. Los modelos actuales de aprendizaje profundo han mejorado en varios aspectos, como el rendimiento predictivo y el tiempo de computación, pero aún tienen limitaciones para capturar las complejas relaciones entre el genotipo y el fenotipo, lo que indica que todavía hay margen de mejora en la precisión de la predicción del fenotipo. Este estudio propone de manera innovadora un nuevo método llamado DeepAT, que incluye principalmente una capa de entrada, una capa de extracción de características de datos, una capa de captura de relaciones de características y una capa de salida. Este método puede predecir el rendimiento del trigo basado en datos genotípicos y tiene innovaciones en los siguientes cuatro aspectos: (1) La capa de extracción de características de datos de DeepAT puede extraer vectores de características representativas de datos de SNP de alta dimensión. Al introducir la función de activación ReLU, mejora la capacidad del modelo para expresar características no lineales y acelera la velocidad de convergencia del modelo; (2) DeepAT puede manejar datos genotípicos de alta dimensión y complejos mientras retiene la mayor cantidad de información útil posible; (3) La capa de captura de relaciones de características de DeepAT captura efectivamente las complejas relaciones entre características de características de baja dimensión a través de un mecanismo de autoatención; (4) En comparación con las estructuras RNN tradicionales, el proceso de entrenamiento del modelo es más eficiente y estable. Utilizando un conjunto de datos de trigo público de AGT, experimentos comparativos con tres métodos de aprendizaje automático y seis métodos de aprendizaje profundo encontraron que DeepAT mostró un mejor rendimiento predictivo que otros métodos, logrando una precisión de predicción del 99,98%, un error cuadrático medio (MSE) de solo 28,93 toneladas y un coeficiente de correlación de Pearson cercano a 1, con los valores predichos de rendimiento coincidiendo estrechamente con los valores observados. Este método proporciona una nueva perspectiva para la predicción del fenotipo asistida por aprendizaje profundo y tiene un gran potencial en la cría inteligente.
Descripción
La selección genómica sirve como una forma efectiva para la cría genética de cultivos, capaz de acortar significativamente el ciclo de cría y mejorar la precisión de la cría. La predicción del fenotipo puede ayudar a identificar variantes genéticas asociadas con fenotipos específicos. Esto proporciona un criterio de selección basado en datos para la selección genómica, lo que hace que el proceso de selección sea más eficiente y dirigido. El aprendizaje profundo se ha convertido en una herramienta importante para la predicción del fenotipo debido a sus habilidades en el aprendizaje automático de características, modelado no lineal y procesamiento de datos de alta dimensión. Los modelos actuales de aprendizaje profundo han mejorado en varios aspectos, como el rendimiento predictivo y el tiempo de computación, pero aún tienen limitaciones para capturar las complejas relaciones entre el genotipo y el fenotipo, lo que indica que todavía hay margen de mejora en la precisión de la predicción del fenotipo. Este estudio propone de manera innovadora un nuevo método llamado DeepAT, que incluye principalmente una capa de entrada, una capa de extracción de características de datos, una capa de captura de relaciones de características y una capa de salida. Este método puede predecir el rendimiento del trigo basado en datos genotípicos y tiene innovaciones en los siguientes cuatro aspectos: (1) La capa de extracción de características de datos de DeepAT puede extraer vectores de características representativas de datos de SNP de alta dimensión. Al introducir la función de activación ReLU, mejora la capacidad del modelo para expresar características no lineales y acelera la velocidad de convergencia del modelo; (2) DeepAT puede manejar datos genotípicos de alta dimensión y complejos mientras retiene la mayor cantidad de información útil posible; (3) La capa de captura de relaciones de características de DeepAT captura efectivamente las complejas relaciones entre características de características de baja dimensión a través de un mecanismo de autoatención; (4) En comparación con las estructuras RNN tradicionales, el proceso de entrenamiento del modelo es más eficiente y estable. Utilizando un conjunto de datos de trigo público de AGT, experimentos comparativos con tres métodos de aprendizaje automático y seis métodos de aprendizaje profundo encontraron que DeepAT mostró un mejor rendimiento predictivo que otros métodos, logrando una precisión de predicción del 99,98%, un error cuadrático medio (MSE) de solo 28,93 toneladas y un coeficiente de correlación de Pearson cercano a 1, con los valores predichos de rendimiento coincidiendo estrechamente con los valores observados. Este método proporciona una nueva perspectiva para la predicción del fenotipo asistida por aprendizaje profundo y tiene un gran potencial en la cría inteligente.