Estimación del contenido de agua de hojas de pera aromática de Korla utilizando espectroscopía de infrarrojo cercano combinada con aprendizaje automático
Autores: Yu, Mingyang; Fan, Weifan; Wang, Lanfei; Chen, Yufeng; Wang, Hao; Guo, Kailu; Bao, Jianping
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Estimación del contenido de agua de hojas de pera aromática de Korla utilizando espectroscopía de infrarrojo cercano combinada con aprendizaje automático
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Contenido de agua de la hoja
Modelado
Características espectrales
División del conjunto de datos
Técnicas de preprocesamiento
Modelos de predicción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
En la producción agrícola moderna, estimar con precisión el contenido de agua en las hojas (LWC) de la pera fragante de Korla es crucial para lograr una irrigación científica y garantizar la calidad de la fruta. Sin embargo, la construcción de modelos de predicción de LWC precisos y efectivos sigue siendo un desafío debido a limitaciones en la selección de muestras, análisis de características espectrales y aplicabilidad del modelo. Para abordar estos problemas, este estudio se llevó a cabo para optimizar sistemáticamente el proceso. Durante la recolección de muestras, se empleó un método de división aleatoria para dividir el conjunto de datos en conjuntos de modelado y prueba en una proporción de 75%:25%. Este enfoque garantiza la eficiencia computacional, evita la fuga de datos y equilibra las necesidades de entrenamiento y evaluación, especialmente para conjuntos de datos de tamaño pequeño a mediano. Específicamente, en la etapa S1, se asignaron 352 muestras al conjunto de modelado y 108 al conjunto de prueba, mientras que en la etapa S2, se asignaron 137 y 58 muestras, respectivamente. El análisis reveló ligeras diferencias en la distribución de LWC y la desviación estándar entre los conjuntos de modelado y prueba, validando la rigurosidad científica de la división del conjunto de datos. Por ejemplo, la distribución de LWC en el conjunto de modelado de S1 oscilaba entre 4.88% y 83.45%, con una desviación estándar de 11.33%. El proceso de adquisición espectral dentro del rango de 4000 cm a 10,000 cm mostró tendencias de variación de absorbancia complejas, mostrando características distintas en diferentes intervalos. Técnicas de preprocesamiento como el suavizado de convolución SG, MSC y SNV redujeron significativamente la variabilidad de la absorbancia y mejoraron las características espectrales. Notablemente, la selección de bandas de características de LWC difería notablemente entre las etapas S1 y S2. Por ejemplo, en S1, las bandas de características SNV-SPA (algoritmo de proyecciones sucesivas) se concentraban alrededor de 5000 cm, 6000 cm y 7000 cm, mientras que sus posiciones se desplazaban significativamente en S2, reflejando la dinámica de crecimiento de la pera fragante de Korla. Durante la fase de construcción del modelo, se compararon varios algoritmos, incluidos la Regresión Forestal Aleatoria (RFR), la Red Neuronal de Retropropagación (BP) y la Regresión de Vectores de Soporte (SVR). Bajo diferentes selecciones de características, el modelo RFR demostró una fuerte capacidad predictiva con coeficientes de determinación (R) superiores a 0.75 y errores cuadráticos medios (RMSE) por debajo de 0.7%. Específicamente, el modelo SNV-CARS-BP logró un R de 0.81594 en S1, mientras que el modelo SNV-SPA-RFR alcanzó un R de 0.817756 en S2, con desviaciones relativas entre los valores predichos y reales de menos del 5%. Estos resultados brindan un sólido respaldo para la monitorización precisa de LWC de la pera fragante de Korla y ofrecen ideas valiosas para investigaciones posteriores.
Descripción
En la producción agrícola moderna, estimar con precisión el contenido de agua en las hojas (LWC) de la pera fragante de Korla es crucial para lograr una irrigación científica y garantizar la calidad de la fruta. Sin embargo, la construcción de modelos de predicción de LWC precisos y efectivos sigue siendo un desafío debido a limitaciones en la selección de muestras, análisis de características espectrales y aplicabilidad del modelo. Para abordar estos problemas, este estudio se llevó a cabo para optimizar sistemáticamente el proceso. Durante la recolección de muestras, se empleó un método de división aleatoria para dividir el conjunto de datos en conjuntos de modelado y prueba en una proporción de 75%:25%. Este enfoque garantiza la eficiencia computacional, evita la fuga de datos y equilibra las necesidades de entrenamiento y evaluación, especialmente para conjuntos de datos de tamaño pequeño a mediano. Específicamente, en la etapa S1, se asignaron 352 muestras al conjunto de modelado y 108 al conjunto de prueba, mientras que en la etapa S2, se asignaron 137 y 58 muestras, respectivamente. El análisis reveló ligeras diferencias en la distribución de LWC y la desviación estándar entre los conjuntos de modelado y prueba, validando la rigurosidad científica de la división del conjunto de datos. Por ejemplo, la distribución de LWC en el conjunto de modelado de S1 oscilaba entre 4.88% y 83.45%, con una desviación estándar de 11.33%. El proceso de adquisición espectral dentro del rango de 4000 cm a 10,000 cm mostró tendencias de variación de absorbancia complejas, mostrando características distintas en diferentes intervalos. Técnicas de preprocesamiento como el suavizado de convolución SG, MSC y SNV redujeron significativamente la variabilidad de la absorbancia y mejoraron las características espectrales. Notablemente, la selección de bandas de características de LWC difería notablemente entre las etapas S1 y S2. Por ejemplo, en S1, las bandas de características SNV-SPA (algoritmo de proyecciones sucesivas) se concentraban alrededor de 5000 cm, 6000 cm y 7000 cm, mientras que sus posiciones se desplazaban significativamente en S2, reflejando la dinámica de crecimiento de la pera fragante de Korla. Durante la fase de construcción del modelo, se compararon varios algoritmos, incluidos la Regresión Forestal Aleatoria (RFR), la Red Neuronal de Retropropagación (BP) y la Regresión de Vectores de Soporte (SVR). Bajo diferentes selecciones de características, el modelo RFR demostró una fuerte capacidad predictiva con coeficientes de determinación (R) superiores a 0.75 y errores cuadráticos medios (RMSE) por debajo de 0.7%. Específicamente, el modelo SNV-CARS-BP logró un R de 0.81594 en S1, mientras que el modelo SNV-SPA-RFR alcanzó un R de 0.817756 en S2, con desviaciones relativas entre los valores predichos y reales de menos del 5%. Estos resultados brindan un sólido respaldo para la monitorización precisa de LWC de la pera fragante de Korla y ofrecen ideas valiosas para investigaciones posteriores.