Explorando algoritmo de aumento de datos para mejorar la predicción genómica de cultivares de alto rango
Autores: Montesinos-López, Osval A.; Sivakumar, Arvinth; Huerta Prado, Gloria Isabel; Salinas-Ruiz, Josafhat; Agbona, Afolabi; Ortiz Reyes, Axel Efraín; Alnowibet, Khalid; Ortiz, Rodomiro; Montesinos-López, Abelardo; Crossa, José
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Explorando algoritmo de aumento de datos para mejorar la predicción genómica de cultivares de alto rango
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Selección genómica
Aumento de datos
Precisión de predicción
Método de aprendizaje automático
Mejoramiento de plantas
Mejoramiento animal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La selección genómica (GS) es un método revolucionario de aprendizaje automático estadístico para avanzar en la cría de plantas y animales. Sin embargo, su implementación práctica sigue siendo desafiante debido a numerosos factores que afectan su rendimiento predictivo. Esta investigación explora el potencial de la ampliación de datos para mejorar la precisión de la predicción en conjuntos de datos enteros y específicamente dentro del 20% superior del conjunto de pruebas. Nuestros hallazgos indican que, en general, el método de ampliación de datos (método A), en comparación con el modelo convencional (método C) y evaluado utilizando el Error de Predicción Absoluto del Arcotangente Medio (MAAPE) y el error cuadrático medio normalizado (NRMSE), no mejoró la precisión de la predicción para las variedades no observadas. Sin embargo, se observaron mejoras significativas en la precisión de la predicción (evidenciadas por la reducción del error de predicción) cuando la ampliación de datos se aplicó exclusivamente al 20% superior del conjunto de pruebas. Específicamente, se observaron reducciones en MAAPE_20 y NRMSE_20 del 52.86% y 41.05%, respectivamente, en varios conjuntos de datos. Se necesita una investigación adicional para refinar las técnicas de ampliación de datos para su uso efectivo en la predicción genómica.
Descripción
La selección genómica (GS) es un método revolucionario de aprendizaje automático estadístico para avanzar en la cría de plantas y animales. Sin embargo, su implementación práctica sigue siendo desafiante debido a numerosos factores que afectan su rendimiento predictivo. Esta investigación explora el potencial de la ampliación de datos para mejorar la precisión de la predicción en conjuntos de datos enteros y específicamente dentro del 20% superior del conjunto de pruebas. Nuestros hallazgos indican que, en general, el método de ampliación de datos (método A), en comparación con el modelo convencional (método C) y evaluado utilizando el Error de Predicción Absoluto del Arcotangente Medio (MAAPE) y el error cuadrático medio normalizado (NRMSE), no mejoró la precisión de la predicción para las variedades no observadas. Sin embargo, se observaron mejoras significativas en la precisión de la predicción (evidenciadas por la reducción del error de predicción) cuando la ampliación de datos se aplicó exclusivamente al 20% superior del conjunto de pruebas. Específicamente, se observaron reducciones en MAAPE_20 y NRMSE_20 del 52.86% y 41.05%, respectivamente, en varios conjuntos de datos. Se necesita una investigación adicional para refinar las técnicas de ampliación de datos para su uso efectivo en la predicción genómica.