Cereal y pronóstico de rendimiento de colza en Polonia a nivel regional utilizando modelos de aprendizaje automático y estadísticos clásicos
Autores: Okupska, Edyta; Gozdowski, Dariusz; Pudeko, Rafa; Wójcik-Gront, Elbieta
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Cereal y pronóstico de rendimiento de colza en Polonia a nivel regional utilizando modelos de aprendizaje automático y estadísticos clásicos
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Estudio
Predicción de rendimiento
Cereales
Colza
Modelos
Aprendizaje automático
Regresión lineal
NDVI
CWB
Coeficientes de correlación
Valores de R
Bosque aleatorio
Red neuronal
Errores
Tamaño de la muestra
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Este estudio realizó la predicción de rendimiento en temporada, alrededor de 2-3 meses antes de la cosecha, para cereales y colza a nivel de provincia en Polonia para 2009-2024. Se emplearon varios modelos, incluyendo algoritmos de aprendizaje automático y regresión lineal múltiple. El índice de vegetación de diferencia normalizada (NDVI) derivado de satélites y el balance hídrico climático (CWB), calculado utilizando datos meteorológicos, fueron tratados como predictores del rendimiento de los cultivos. La precisión de los modelos fue comparada para identificar el enfoque óptimo. Los coeficientes de correlación más fuertes con el rendimiento de los cultivos se observaron para el NDVI a principios de marzo, que variaban de 0.454 para la colza a 0.503 para el centeno. Dependiendo del cultivo, los valores de R más altos se observaron para diferentes modelos de predicción, que variaban de 0.654 para la colza basada en el modelo de bosque aleatorio a 0.777 para cereales básicos basados en regresión lineal. El modelo de bosque aleatorio fue el mejor para el rendimiento de la colza, mientras que para los cereales, la mejor predicción se observó para modelos de regresión lineal múltiple o de red neuronal. Para los cultivos estudiados, todos los modelos tuvieron errores absolutos medios y errores cuadráticos medios que no excedieron los 6 dt/ha, lo cual es relativamente pequeño ya que está por debajo del 20% del rendimiento medio. Para los mejores modelos, en la mayoría de los casos, los errores relativos no fueron superiores al 10% del rendimiento medio. Los resultados demostraron que la regresión lineal y los modelos de aprendizaje automático se caracterizan por predicciones similares, probablemente debido al tamaño de muestra relativamente pequeño (256 observaciones).
Descripción
Este estudio realizó la predicción de rendimiento en temporada, alrededor de 2-3 meses antes de la cosecha, para cereales y colza a nivel de provincia en Polonia para 2009-2024. Se emplearon varios modelos, incluyendo algoritmos de aprendizaje automático y regresión lineal múltiple. El índice de vegetación de diferencia normalizada (NDVI) derivado de satélites y el balance hídrico climático (CWB), calculado utilizando datos meteorológicos, fueron tratados como predictores del rendimiento de los cultivos. La precisión de los modelos fue comparada para identificar el enfoque óptimo. Los coeficientes de correlación más fuertes con el rendimiento de los cultivos se observaron para el NDVI a principios de marzo, que variaban de 0.454 para la colza a 0.503 para el centeno. Dependiendo del cultivo, los valores de R más altos se observaron para diferentes modelos de predicción, que variaban de 0.654 para la colza basada en el modelo de bosque aleatorio a 0.777 para cereales básicos basados en regresión lineal. El modelo de bosque aleatorio fue el mejor para el rendimiento de la colza, mientras que para los cereales, la mejor predicción se observó para modelos de regresión lineal múltiple o de red neuronal. Para los cultivos estudiados, todos los modelos tuvieron errores absolutos medios y errores cuadráticos medios que no excedieron los 6 dt/ha, lo cual es relativamente pequeño ya que está por debajo del 20% del rendimiento medio. Para los mejores modelos, en la mayoría de los casos, los errores relativos no fueron superiores al 10% del rendimiento medio. Los resultados demostraron que la regresión lineal y los modelos de aprendizaje automático se caracterizan por predicciones similares, probablemente debido al tamaño de muestra relativamente pequeño (256 observaciones).