Análisis comparativo de algoritmos de importancia de características para la predicción de biomasa y nutrientes sobre el suelo en pastizales utilizando datos hiperespectrales
Autores: Zhao, Yue; Xu, Dawei; Li, Shuzhen; Tang, Kai; Yu, Hongliang; Yan, Ruirui; Li, Zhenwang; Wang, Xu; Xin, Xiaoping
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Análisis comparativo de algoritmos de importancia de características para la predicción de biomasa y nutrientes sobre el suelo en pastizales utilizando datos hiperespectrales
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Rendimiento del forraje
Composición de nutrientes
Teledetección hiperespectral
Análisis de longitud de onda
Bandas espectrales
Estimación de nutrientes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
La estimación del rendimiento de forraje y la composición de nutrientes utilizando teledetección hiperespectral es un desafío importante. Sin embargo, todavía existe una falta de investigación exhaustiva sobre la longitud de onda óptima para el análisis de diversos nutrientes en el pasto. En esta investigación, realizada en el Distrito de Hailar, Ciudad de Hulunber, Región Autónoma de Mongolia Interior, China, se recopilaron 126 conjuntos de datos hiperespectrales, que abarcan un rango espectral de 350 a 1800 nanómetros. El objetivo principal fue identificar bandas espectrales clave para estimar el rendimiento de materia seca de forraje (DMY), contenido de nitrógeno (NC), fibra detergente neutra (NDF) y fibra detergente ácida (ADF) utilizando análisis de componentes principales (PCA), bosques aleatorios (RF) y análisis de SHapley Additive exPlanations (SHAP), y luego se utilizó el modelo de RF y algoritmo de Extra-Trees (ERT) para predecir la biomasa aérea (AGB) y los parámetros de nutrientes utilizando las bandas espectrales y los índices de vegetación optimizados. Nuestro enfoque minimiza eficazmente la redundancia en los datos hiperespectrales al emplear selectivamente bandas espectrales cruciales, mejorando así la precisión de la estimación de nutrientes del forraje. PCA identificó las bandas más variables en 400 nm, 520-550 nm, 670-720 nm y 930-950 nm, reflejando su importancia espectral general en lugar de una relación con nutrientes específicos del forraje. Un análisis adicional utilizando la importancia de características de RF señaló bandas influyentes, principalmente dentro de 930-940 nm y 700-730 nm. El análisis de SHAP confirmó bandas críticas para DMY (965 nm, 712 nm y 1652 nm), NC (1390 nm y 713 nm), ADF (1390 nm y 715-725 nm) y NDF (400 nm, 983 nm, 1350 nm y 1800 nm). La precisión de ajuste para ADF estimada utilizando RF fue menor ( = 0,58), mientras que la precisión de ajuste para otros indicadores fue mayor ( >= 0,59). El rendimiento y la precisión de predicción de ERT ( = 0,63) fueron notablemente superiores a los de RF. En conclusión, nuestro método identifica eficazmente bandas influyentes, optimizando la estimación del rendimiento y calidad del forraje.
Descripción
La estimación del rendimiento de forraje y la composición de nutrientes utilizando teledetección hiperespectral es un desafío importante. Sin embargo, todavía existe una falta de investigación exhaustiva sobre la longitud de onda óptima para el análisis de diversos nutrientes en el pasto. En esta investigación, realizada en el Distrito de Hailar, Ciudad de Hulunber, Región Autónoma de Mongolia Interior, China, se recopilaron 126 conjuntos de datos hiperespectrales, que abarcan un rango espectral de 350 a 1800 nanómetros. El objetivo principal fue identificar bandas espectrales clave para estimar el rendimiento de materia seca de forraje (DMY), contenido de nitrógeno (NC), fibra detergente neutra (NDF) y fibra detergente ácida (ADF) utilizando análisis de componentes principales (PCA), bosques aleatorios (RF) y análisis de SHapley Additive exPlanations (SHAP), y luego se utilizó el modelo de RF y algoritmo de Extra-Trees (ERT) para predecir la biomasa aérea (AGB) y los parámetros de nutrientes utilizando las bandas espectrales y los índices de vegetación optimizados. Nuestro enfoque minimiza eficazmente la redundancia en los datos hiperespectrales al emplear selectivamente bandas espectrales cruciales, mejorando así la precisión de la estimación de nutrientes del forraje. PCA identificó las bandas más variables en 400 nm, 520-550 nm, 670-720 nm y 930-950 nm, reflejando su importancia espectral general en lugar de una relación con nutrientes específicos del forraje. Un análisis adicional utilizando la importancia de características de RF señaló bandas influyentes, principalmente dentro de 930-940 nm y 700-730 nm. El análisis de SHAP confirmó bandas críticas para DMY (965 nm, 712 nm y 1652 nm), NC (1390 nm y 713 nm), ADF (1390 nm y 715-725 nm) y NDF (400 nm, 983 nm, 1350 nm y 1800 nm). La precisión de ajuste para ADF estimada utilizando RF fue menor ( = 0,58), mientras que la precisión de ajuste para otros indicadores fue mayor ( >= 0,59). El rendimiento y la precisión de predicción de ERT ( = 0,63) fueron notablemente superiores a los de RF. En conclusión, nuestro método identifica eficazmente bandas influyentes, optimizando la estimación del rendimiento y calidad del forraje.