Selección Genómica para Rasgos de Cashmere en Cabras Cashmere de Mongolia Interior Utilizando Métodos de Bosque Aleatorio, Árbol de Decisión de Aumento de Gradiente, Aumento de Gradiente Extremo y Máquina de Aumento de Gradiente Ligero
Autores: Liu, Jiaqi; Yan, Xiaochun; Li, Wenze; Xue, Shan-Hui; Wang, Zhiying; Su, Rui
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Selección Genómica para Rasgos de Cashmere en Cabras Cashmere de Mongolia Interior Utilizando Métodos de Bosque Aleatorio, Árbol de Decisión de Aumento de Gradiente, Aumento de Gradiente Extremo y Máquina de Aumento de Gradiente Ligero
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Aprendizaje automático
Predicción genómica
Características de cachemira
Cabras de cachemira de Mongolia Interior
Algoritmos
Precisión de predicción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 7
Citaciones: Sin citaciones
En los últimos años, el Aprendizaje Automático (ML) ha ganado una atención creciente por sus aplicaciones en la predicción genómica. El ML procesa de manera efectiva datos genómicos de alta dimensión y establece modelos no lineales. En comparación con los métodos tradicionales de Selección Genómica (GS), los algoritmos de ML mejoran la eficiencia computacional y ofrecen una mayor precisión en la predicción. Por lo tanto, este estudio se esfuerza por lograr el algoritmo de aprendizaje automático óptimo para la selección a nivel genómico de rasgos de cachemira en cabras de cachemira de Mongolia Interior. Este estudio comparó la precisión de la predicción genómica de rasgos de cachemira utilizando cuatro algoritmos de aprendizaje automático: Bosque Aleatorio (RF), Árbol de Aumento de Gradiente Extremo (XGBoost), Árbol de Decisión de Aumento de Gradiente (GBDT) y LightGBM, basándose en datos genotípicos y datos fenotípicos de rasgos de cachemira de 2299 cabras de cachemira de Mongolia Interior. Los resultados mostraron que, tras la optimización de parámetros, LightGBM logró la mayor precisión de selección para la longitud de la fibra (56.4%), RF logró la mayor precisión de selección para la producción de cachemira (35.2%), y GBDT logró la mayor precisión de selección para el diámetro de la cachemira (40.4%), en comparación con GBLUP, la precisión mejoró entre 0.8 y 2.7%. Entre los tres rasgos, XGBoost mostró la menor precisión de predicción, con 0.541, 0.309 y 0.387. Además, tras la optimización de parámetros, la precisión de predicción de los cuatro métodos de aprendizaje automático para la finura de la cachemira, el rendimiento de la cachemira y la longitud de la fibra mejoró en un promedio de 2.9%, 2.7% y 3.8%, respectivamente. El error cuadrático medio (MSE) y el error absoluto medio (MAE) para todos los métodos de aprendizaje automático también disminuyeron, lo que indica que la optimización de hiperparámetros puede mejorar la precisión de predicción en los algoritmos de ML.
Descripción
En los últimos años, el Aprendizaje Automático (ML) ha ganado una atención creciente por sus aplicaciones en la predicción genómica. El ML procesa de manera efectiva datos genómicos de alta dimensión y establece modelos no lineales. En comparación con los métodos tradicionales de Selección Genómica (GS), los algoritmos de ML mejoran la eficiencia computacional y ofrecen una mayor precisión en la predicción. Por lo tanto, este estudio se esfuerza por lograr el algoritmo de aprendizaje automático óptimo para la selección a nivel genómico de rasgos de cachemira en cabras de cachemira de Mongolia Interior. Este estudio comparó la precisión de la predicción genómica de rasgos de cachemira utilizando cuatro algoritmos de aprendizaje automático: Bosque Aleatorio (RF), Árbol de Aumento de Gradiente Extremo (XGBoost), Árbol de Decisión de Aumento de Gradiente (GBDT) y LightGBM, basándose en datos genotípicos y datos fenotípicos de rasgos de cachemira de 2299 cabras de cachemira de Mongolia Interior. Los resultados mostraron que, tras la optimización de parámetros, LightGBM logró la mayor precisión de selección para la longitud de la fibra (56.4%), RF logró la mayor precisión de selección para la producción de cachemira (35.2%), y GBDT logró la mayor precisión de selección para el diámetro de la cachemira (40.4%), en comparación con GBLUP, la precisión mejoró entre 0.8 y 2.7%. Entre los tres rasgos, XGBoost mostró la menor precisión de predicción, con 0.541, 0.309 y 0.387. Además, tras la optimización de parámetros, la precisión de predicción de los cuatro métodos de aprendizaje automático para la finura de la cachemira, el rendimiento de la cachemira y la longitud de la fibra mejoró en un promedio de 2.9%, 2.7% y 3.8%, respectivamente. El error cuadrático medio (MSE) y el error absoluto medio (MAE) para todos los métodos de aprendizaje automático también disminuyeron, lo que indica que la optimización de hiperparámetros puede mejorar la precisión de predicción en los algoritmos de ML.