Elegir métodos de selección de características para modelar espacialmente las propiedades de fertilidad del suelo a escala de campo
Autores: Ferhatoglu, Caner; Miller, Bradley A.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Elegir métodos de selección de características para modelar espacialmente las propiedades de fertilidad del suelo a escala de campo
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Creciente disponibilidad
Covariables ambientales
Selección de características
Aprendizaje automático
Mapeo digital del suelo
Propiedades de fertilidad del suelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Con la creciente disponibilidad de covariables ambientales, la selección de características (FS) se está convirtiendo en una tarea esencial para aplicar el aprendizaje automático (ML) en la cartografía digital del suelo (DSM). En este estudio, se comparó la efectividad de seis tipos de métodos de FS de cuatro categorías (filtro, envoltura, incrustado e híbrido). Estos algoritmos de FS seleccionaron covariables relevantes de un conjunto exhaustivo de 1049 covariables ambientales para predecir cinco propiedades de fertilidad del suelo en diez campos, en combinación con diez algoritmos de ML diferentes. El rendimiento del modelo resultante se comparó mediante tres métricas diferentes (R de validación cruzada de 10 pliegues (CV), ratio de robustez (RR; desarrollado en este estudio) y validación independiente con el coeficiente de correlación de concordancia de Lin (IV-CCC)). FS mejoró CV, RR e IV-CCC en comparación con los modelos construidos sin FS para la mayoría de los campos y propiedades del suelo. Los métodos de envoltura (BorutaShap) e incrustados (Lasso-FS, Random forest-FS) generalmente condujeron a los modelos óptimos. El método ANOVA-FS basado en filtro en su mayoría condujo a modelos sobreajustados, especialmente para campos con cantidades de muestras más pequeñas. Los modelos basados en árboles de decisión generalmente formaron parte de la combinación óptima de FS y ML. Considerar RR ayudó a identificar combinaciones óptimas de FS y ML que pueden mejorar el rendimiento de DSM en comparación con los modelos producidos a partir de pilas de covariables completas.
Descripción
Con la creciente disponibilidad de covariables ambientales, la selección de características (FS) se está convirtiendo en una tarea esencial para aplicar el aprendizaje automático (ML) en la cartografía digital del suelo (DSM). En este estudio, se comparó la efectividad de seis tipos de métodos de FS de cuatro categorías (filtro, envoltura, incrustado e híbrido). Estos algoritmos de FS seleccionaron covariables relevantes de un conjunto exhaustivo de 1049 covariables ambientales para predecir cinco propiedades de fertilidad del suelo en diez campos, en combinación con diez algoritmos de ML diferentes. El rendimiento del modelo resultante se comparó mediante tres métricas diferentes (R de validación cruzada de 10 pliegues (CV), ratio de robustez (RR; desarrollado en este estudio) y validación independiente con el coeficiente de correlación de concordancia de Lin (IV-CCC)). FS mejoró CV, RR e IV-CCC en comparación con los modelos construidos sin FS para la mayoría de los campos y propiedades del suelo. Los métodos de envoltura (BorutaShap) e incrustados (Lasso-FS, Random forest-FS) generalmente condujeron a los modelos óptimos. El método ANOVA-FS basado en filtro en su mayoría condujo a modelos sobreajustados, especialmente para campos con cantidades de muestras más pequeñas. Los modelos basados en árboles de decisión generalmente formaron parte de la combinación óptima de FS y ML. Considerar RR ayudó a identificar combinaciones óptimas de FS y ML que pueden mejorar el rendimiento de DSM en comparación con los modelos producidos a partir de pilas de covariables completas.