Construcción y optimización de un modelo integrado de predicción de rendimiento basado en las características fenotípicas del arroz cultivado en plantaciones a pequeña escala
Autores: Sun, Jihong; Tian, Peng; Li, Zhaowen; Wang, Xinrui; Zhang, Haokai; Chen, Jiangquan; Qian, Ye
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Construcción y optimización de un modelo integrado de predicción de rendimiento basado en las características fenotípicas del arroz cultivado en plantaciones a pequeña escala
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Modelo de predicción
Rendimiento de arroz
áreas de cultivo a pequeña escala
Métodos de aprendizaje automático
Rasgos fenotípicos
Métodos de conjunto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Un modelo de predicción inteligente para el rendimiento del arroz en áreas de cultivo a pequeña escala puede proporcionar resultados de pronóstico precisos para los agricultores, las empresas de cultivo de arroz y los investigadores, lo que tiene una importancia significativa para las industrias agrícolas y la investigación científica de cultivos dentro de regiones pequeñas. Aunque el aprendizaje automático puede manejar problemas no lineales complejos para mejorar la precisión de la predicción, aún se necesitan mejoras en los modelos para predecir con precisión los rendimientos de arroz en áreas pequeñas que enfrentan entornos de siembra complejos, mejorando así el rendimiento del modelo. Este estudio emplea cuatro rasgos fenotípicos del arroz, a saber, ángulo de la panícula, longitud de la panícula, longitud total de las ramas y número de granos, junto con siete métodos de aprendizaje automático: regresión lineal múltiple, máquina de vectores de soporte, MLP, bosque aleatorio, GBR, XGBoost y LightGBM, para construir un grupo de modelos de predicción de rendimiento. Posteriormente, los tres mejores modelos con el mejor rendimiento en las predicciones de modelos individuales se integran utilizando métodos de conjunto de votación y apilamiento para obtener el modelo integrado óptimo. Finalmente, se explora el impacto de diferentes rasgos fenotípicos del arroz en el rendimiento del modelo de conjunto apilado. Los resultados experimentales indican que el modelo de bosque aleatorio es el mejor después de la modelización de aprendizaje automático individual, con valores de RMSE, R y MAPE de 0.2777, 0.9062 y 17.04%, respectivamente. Después de la integración del modelo, Stacking-3m demuestra el mejor rendimiento, con valores de RMSE, R y MAPE de 0.2483, 0.9250 y 6.90%, respectivamente. En comparación con el rendimiento después de la modelización del bosque aleatorio, el RMSE disminuyó un 10.58%, R aumentó un 1.88% y MAPE disminuyó un 0.76%, lo que indica una mejora en el rendimiento del modelo después del conjunto de apilamiento. El modelo Stacking-3m, que demostró las mejores métricas de evaluación integral, fue seleccionado para la validación del modelo, y los resultados de validación fueron satisfactorios, con valores de MAE, R y MAPE de 8.3384, 0.9285 y 0.2689, respectivamente. Los hallazgos de investigación anteriores demuestran que este modelo integrado posee un alto valor práctico y cubre una brecha en la predicción precisa del rendimiento para el cultivo de arroz a pequeña escala en la región del altiplano de Yunnan.
Descripción
Un modelo de predicción inteligente para el rendimiento del arroz en áreas de cultivo a pequeña escala puede proporcionar resultados de pronóstico precisos para los agricultores, las empresas de cultivo de arroz y los investigadores, lo que tiene una importancia significativa para las industrias agrícolas y la investigación científica de cultivos dentro de regiones pequeñas. Aunque el aprendizaje automático puede manejar problemas no lineales complejos para mejorar la precisión de la predicción, aún se necesitan mejoras en los modelos para predecir con precisión los rendimientos de arroz en áreas pequeñas que enfrentan entornos de siembra complejos, mejorando así el rendimiento del modelo. Este estudio emplea cuatro rasgos fenotípicos del arroz, a saber, ángulo de la panícula, longitud de la panícula, longitud total de las ramas y número de granos, junto con siete métodos de aprendizaje automático: regresión lineal múltiple, máquina de vectores de soporte, MLP, bosque aleatorio, GBR, XGBoost y LightGBM, para construir un grupo de modelos de predicción de rendimiento. Posteriormente, los tres mejores modelos con el mejor rendimiento en las predicciones de modelos individuales se integran utilizando métodos de conjunto de votación y apilamiento para obtener el modelo integrado óptimo. Finalmente, se explora el impacto de diferentes rasgos fenotípicos del arroz en el rendimiento del modelo de conjunto apilado. Los resultados experimentales indican que el modelo de bosque aleatorio es el mejor después de la modelización de aprendizaje automático individual, con valores de RMSE, R y MAPE de 0.2777, 0.9062 y 17.04%, respectivamente. Después de la integración del modelo, Stacking-3m demuestra el mejor rendimiento, con valores de RMSE, R y MAPE de 0.2483, 0.9250 y 6.90%, respectivamente. En comparación con el rendimiento después de la modelización del bosque aleatorio, el RMSE disminuyó un 10.58%, R aumentó un 1.88% y MAPE disminuyó un 0.76%, lo que indica una mejora en el rendimiento del modelo después del conjunto de apilamiento. El modelo Stacking-3m, que demostró las mejores métricas de evaluación integral, fue seleccionado para la validación del modelo, y los resultados de validación fueron satisfactorios, con valores de MAE, R y MAPE de 8.3384, 0.9285 y 0.2689, respectivamente. Los hallazgos de investigación anteriores demuestran que este modelo integrado posee un alto valor práctico y cubre una brecha en la predicción precisa del rendimiento para el cultivo de arroz a pequeña escala en la región del altiplano de Yunnan.