El equilibrio entre sensibilidad y especificidad mejora el ranking superior e inferior en la predicción genómica de cultivares
Autores: Montesinos-López, Osval A.; Kismiantini, ; Alemu, Admas; Montesinos-López, Abelardo; Montesinos-López, José Cricelio; Crossa, Jose
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
El equilibrio entre sensibilidad y especificidad mejora el ranking superior e inferior en la predicción genómica de cultivares
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Selección genómica
Metodología
Modelos
Líneas superiores
Líneas inferiores
Rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 10
Citaciones: Sin citaciones
La selección genómica (SG) es una metodología predictiva que está revolucionando la cría de plantas y animales. Sin embargo, la aplicación práctica de la metodología SG es un desafío, ya que una implementación exitosa requiere una buena identificación de las mejores líneas. Por esta razón, se han propuesto algunos enfoques para poder seleccionar las líneas superiores (o inferiores) con más precisión. A pesar de la variada popularidad de los métodos, algunos son notablemente más eficientes que otros; este artículo profundiza en los fundamentos de estas técnicas. Utilizamos cinco modelos/métodos: (1) RC, conocido como el Mejor Predictor Lineal Inbiased Bayesiano (GBLUP); (2) R, que es como RC pero utiliza un umbral; (3) RO, Regresión Óptima, que aprovecha el modelo RC en su proceso de entrenamiento para ajustar el umbral; (4) B, modelo Probit Binario Bayesiano de Umbral (TGBLUP) con un umbral de 0.5 para clasificar los cultivares como superiores o no superiores; (5) BO es el TGBLUP pero el umbral utilizado es un umbral de probabilidad óptimo que garantiza una sensibilidad y especificidad similares. También presentamos una comparación de referencia de los enfoques existentes para seleccionar a los mejores (o peores) desempeñadores, utilizando cinco conjuntos de datos reales para un análisis exhaustivo. Para los métodos que requieren un proceso de ajuste riguroso, sugerimos un enfoque de ajuste simplificado que disminuye significativamente el tiempo de implementación sin comprometer notablemente el rendimiento. Nuestro análisis reveló que el método de regresión óptima (RO) superó a otros modelos en los cinco conjuntos de datos reales, logrando resultados superiores en términos de la puntuación F1. Específicamente, RO fue más efectivo que los modelos R, B, RC y BO en un 60.87, 42.37, 17.63 y 9.62%, respectivamente. Al observar el coeficiente Kappa, el modelo RO fue mejor que los modelos B, BO, R y RC en un 37.46, 36.21, 52.18 y 3.95%, respectivamente. En términos de sensibilidad, el modelo RO superó a los modelos B, R y RC en 145.74, 250.41 y 86.20, respectivamente. El segundo mejor modelo fue el modelo BO. Es importante señalar que en la primera etapa, los enfoques BO y RO entrenan un modelo de clasificación y regresión, respectivamente, para clasificar las líneas como superiores (inferiores) o no superiores (no inferiores). Sin embargo, tanto los enfoques BO como RO optimizan un umbral en la segunda etapa para realizar la clasificación de las líneas que minimiza la diferencia entre la sensibilidad y la especificidad. Los métodos BO y RO son superiores para la selección de las líneas superiores (o inferiores). Por esta razón, animamos a los criadores a adoptar estos enfoques para aumentar la ganancia genética en los programas de cría de plantas.
Descripción
La selección genómica (SG) es una metodología predictiva que está revolucionando la cría de plantas y animales. Sin embargo, la aplicación práctica de la metodología SG es un desafío, ya que una implementación exitosa requiere una buena identificación de las mejores líneas. Por esta razón, se han propuesto algunos enfoques para poder seleccionar las líneas superiores (o inferiores) con más precisión. A pesar de la variada popularidad de los métodos, algunos son notablemente más eficientes que otros; este artículo profundiza en los fundamentos de estas técnicas. Utilizamos cinco modelos/métodos: (1) RC, conocido como el Mejor Predictor Lineal Inbiased Bayesiano (GBLUP); (2) R, que es como RC pero utiliza un umbral; (3) RO, Regresión Óptima, que aprovecha el modelo RC en su proceso de entrenamiento para ajustar el umbral; (4) B, modelo Probit Binario Bayesiano de Umbral (TGBLUP) con un umbral de 0.5 para clasificar los cultivares como superiores o no superiores; (5) BO es el TGBLUP pero el umbral utilizado es un umbral de probabilidad óptimo que garantiza una sensibilidad y especificidad similares. También presentamos una comparación de referencia de los enfoques existentes para seleccionar a los mejores (o peores) desempeñadores, utilizando cinco conjuntos de datos reales para un análisis exhaustivo. Para los métodos que requieren un proceso de ajuste riguroso, sugerimos un enfoque de ajuste simplificado que disminuye significativamente el tiempo de implementación sin comprometer notablemente el rendimiento. Nuestro análisis reveló que el método de regresión óptima (RO) superó a otros modelos en los cinco conjuntos de datos reales, logrando resultados superiores en términos de la puntuación F1. Específicamente, RO fue más efectivo que los modelos R, B, RC y BO en un 60.87, 42.37, 17.63 y 9.62%, respectivamente. Al observar el coeficiente Kappa, el modelo RO fue mejor que los modelos B, BO, R y RC en un 37.46, 36.21, 52.18 y 3.95%, respectivamente. En términos de sensibilidad, el modelo RO superó a los modelos B, R y RC en 145.74, 250.41 y 86.20, respectivamente. El segundo mejor modelo fue el modelo BO. Es importante señalar que en la primera etapa, los enfoques BO y RO entrenan un modelo de clasificación y regresión, respectivamente, para clasificar las líneas como superiores (inferiores) o no superiores (no inferiores). Sin embargo, tanto los enfoques BO como RO optimizan un umbral en la segunda etapa para realizar la clasificación de las líneas que minimiza la diferencia entre la sensibilidad y la especificidad. Los métodos BO y RO son superiores para la selección de las líneas superiores (o inferiores). Por esta razón, animamos a los criadores a adoptar estos enfoques para aumentar la ganancia genética en los programas de cría de plantas.