Aplicación de aprendizaje profundo para la clasificación de cultivos a través de imágenes de teledetección multitemporales
Autores: Li, Qianjing; Tian, Jia; Tian, Qingjiu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aplicación de aprendizaje profundo para la clasificación de cultivos a través de imágenes de teledetección multitemporales
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Aprendizaje profundo
Imágenes multitemporales
Clasificación de cultivos
3D-CNN
LSTM
ConvLSTM2D
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
La combinación de imágenes multitemporales y aprendizaje profundo es una forma eficiente de obtener distribuciones precisas de cultivos y ha atraído cada vez más atención. Sin embargo, pocos estudios han comparado modelos de aprendizaje profundo con diferentes arquitecturas, por lo que aún no está claro cómo se debe seleccionar un modelo de aprendizaje profundo para la clasificación de cultivos multitemporales y cuál es la mejor precisión posible. Para abordar este problema, el presente trabajo compara y analiza una aplicación de clasificación de cultivos basada en modelos de aprendizaje profundo y diferentes datos de series temporales para explotar la posibilidad de mejorar la precisión de la clasificación de cultivos. Usando imágenes multitemporales del Sentinel-2 como datos fuente, se construyen conjuntos de datos de clasificación de series temporales basados en índices de vegetación (VIs) y apilamiento espectral, respectivamente, tras lo cual comparamos y evaluamos la aplicación de clasificación de cultivos basada en conjuntos de datos de series temporales y cinco arquitecturas de aprendizaje profundo: (1) redes neuronales convolucionales unidimensionales (1D-CNN), (2) memoria a corto plazo (LSTM), (3) redes neuronales convolucionales bidimensionales (2D-CNN), (4) redes neuronales convolucionales tridimensionales (3D-CNN) y (5) convolución LSTM bidimensional (ConvLSTM2D). Los resultados muestran que la precisión tanto de 1D-CNN (92.5%) como de LSTM (93.25%) es mayor que la de random forest (~ 91%) al usar una característica temporal única como entrada. El modelo 2D-CNN integra información temporal y espacial y es ligeramente más preciso (94.76%), pero no logra utilizar completamente sus características multiespectrales. La precisión de los modelos 1D-CNN y LSTM integrados con características temporales y multiespectrales es del 96.94% y 96.84%, respectivamente. Sin embargo, ninguno de los modelos puede extraer información espacial. La precisión de los modelos 3D-CNN y ConvLSTM2D es del 97.43% y 97.25%, respectivamente. Los resultados experimentales muestran una precisión limitada para la clasificación de cultivos basada en características temporales únicas, mientras que la combinación de características temporales con información multiespectral o espacial mejora significativamente la precisión de la clasificación. Los modelos 3D-CNN y ConvLSTM2D son, por lo tanto, las mejores arquitecturas de aprendizaje profundo para la clasificación de cultivos multitemporales. Sin embargo, la arquitectura ConvLSTM que combina redes neuronales recurrentes y CNNs debería ser desarrollada aún más para la clasificación de cultivos de imágenes multitemporales.
Descripción
La combinación de imágenes multitemporales y aprendizaje profundo es una forma eficiente de obtener distribuciones precisas de cultivos y ha atraído cada vez más atención. Sin embargo, pocos estudios han comparado modelos de aprendizaje profundo con diferentes arquitecturas, por lo que aún no está claro cómo se debe seleccionar un modelo de aprendizaje profundo para la clasificación de cultivos multitemporales y cuál es la mejor precisión posible. Para abordar este problema, el presente trabajo compara y analiza una aplicación de clasificación de cultivos basada en modelos de aprendizaje profundo y diferentes datos de series temporales para explotar la posibilidad de mejorar la precisión de la clasificación de cultivos. Usando imágenes multitemporales del Sentinel-2 como datos fuente, se construyen conjuntos de datos de clasificación de series temporales basados en índices de vegetación (VIs) y apilamiento espectral, respectivamente, tras lo cual comparamos y evaluamos la aplicación de clasificación de cultivos basada en conjuntos de datos de series temporales y cinco arquitecturas de aprendizaje profundo: (1) redes neuronales convolucionales unidimensionales (1D-CNN), (2) memoria a corto plazo (LSTM), (3) redes neuronales convolucionales bidimensionales (2D-CNN), (4) redes neuronales convolucionales tridimensionales (3D-CNN) y (5) convolución LSTM bidimensional (ConvLSTM2D). Los resultados muestran que la precisión tanto de 1D-CNN (92.5%) como de LSTM (93.25%) es mayor que la de random forest (~ 91%) al usar una característica temporal única como entrada. El modelo 2D-CNN integra información temporal y espacial y es ligeramente más preciso (94.76%), pero no logra utilizar completamente sus características multiespectrales. La precisión de los modelos 1D-CNN y LSTM integrados con características temporales y multiespectrales es del 96.94% y 96.84%, respectivamente. Sin embargo, ninguno de los modelos puede extraer información espacial. La precisión de los modelos 3D-CNN y ConvLSTM2D es del 97.43% y 97.25%, respectivamente. Los resultados experimentales muestran una precisión limitada para la clasificación de cultivos basada en características temporales únicas, mientras que la combinación de características temporales con información multiespectral o espacial mejora significativamente la precisión de la clasificación. Los modelos 3D-CNN y ConvLSTM2D son, por lo tanto, las mejores arquitecturas de aprendizaje profundo para la clasificación de cultivos multitemporales. Sin embargo, la arquitectura ConvLSTM que combina redes neuronales recurrentes y CNNs debería ser desarrollada aún más para la clasificación de cultivos de imágenes multitemporales.