Una Optimización Bayesiana Conjunta para la Clasificación de Imágenes Remotamente Sensadas de Alta Resolución Espacial Utilizando Redes Neuronales Convolucionales Basadas en Objetos
Autores: Azeez, Omer Saud; Shafri, Helmi Z. M.; Alias, Aidi Hizami; Haron, Nuzul Azam
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Una Optimización Bayesiana Conjunta para la Clasificación de Imágenes Remotamente Sensadas de Alta Resolución Espacial Utilizando Redes Neuronales Convolucionales Basadas en Objetos
Categoría
Ciencias Medioambientales
Subcategoría
Ciencias medioambientales generales
Palabras clave
Aprendizaje profundo
Clasificación de imágenes
Análisis de imágenes basado en objetos
Redes neuronales convolucionales
Segmentación multiresolución
Optimización bayesiana
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En los últimos años, la clasificación de imágenes basada en aprendizaje profundo se ha vuelto generalizada, especialmente en aplicaciones de teledetección, debido a su capacidad automática y robusta de extracción de características. Sin embargo, dado que los métodos de aprendizaje profundo operan en parches de imagen de forma rectangular, no pueden extraer con precisión los límites de los objetos, especialmente en entornos urbanos complejos. Como resultado, la combinación de aprendizaje profundo y análisis de imágenes basado en objetos (OBIA) se ha convertido en una nueva vía en los estudios de teledetección. Este artículo presenta un enfoque novedoso para combinar redes neuronales convolucionales (CNN) con OBIA basado en la optimización conjunta de parámetros de segmentación y extracción de características profundas. Se utilizó una técnica bayesiana para encontrar los mejores parámetros para el algoritmo de segmentación multiresolución (MRS) mientras el modelo de CNN aprende las características de la imagen en diferentes capas, logrando una optimización conjunta. El modelo de clasificación propuesto logró la mejor precisión, con 0.96 OA, 0.95 Kappa y 0.96 mIoU en el área de entrenamiento y 0.97 OA, 0.96 Kappa y 0.97 mIoU en el área de prueba, superando varios métodos de referencia, incluyendo Patch CNN, Center OCNN, Random OCNN y Decision Fusion. El análisis de variantes de CNN dentro del flujo de trabajo de clasificación propuesto mostró que el modelo HybridSN logró los mejores resultados en comparación con CNN 2D y 3D. Las capas de CNN 3D y la combinación de capas de CNN 3D y 2D (HybridSN) produjeron precisiones ligeramente mejores que las capas de CNN 2D en cuanto a fidelidad geométrica, extracción de límites de objetos y separación de objetos adyacentes. La optimización bayesiana pudo encontrar parámetros MRS óptimos comparables para las áreas de entrenamiento y prueba, con una calidad excelente medida por AFI (0.046, -0.037) y QR (0.945, 0.932). En el modelo propuesto, se podrían obtener precisiones más altas con tamaños de parche más grandes (por ejemplo, 9 x 9 en comparación con 3 x 3). Además, el modelo propuesto es computacionalmente eficiente, con el entrenamiento más largo siendo de menos de 25 s considerando todos los subprocesos y una única época de entrenamiento. Como resultado, el modelo propuesto puede ser utilizado para aplicaciones urbanas y ambientales que dependen de imágenes satelitales VHR y requieren información sobre el uso del suelo.
Descripción
En los últimos años, la clasificación de imágenes basada en aprendizaje profundo se ha vuelto generalizada, especialmente en aplicaciones de teledetección, debido a su capacidad automática y robusta de extracción de características. Sin embargo, dado que los métodos de aprendizaje profundo operan en parches de imagen de forma rectangular, no pueden extraer con precisión los límites de los objetos, especialmente en entornos urbanos complejos. Como resultado, la combinación de aprendizaje profundo y análisis de imágenes basado en objetos (OBIA) se ha convertido en una nueva vía en los estudios de teledetección. Este artículo presenta un enfoque novedoso para combinar redes neuronales convolucionales (CNN) con OBIA basado en la optimización conjunta de parámetros de segmentación y extracción de características profundas. Se utilizó una técnica bayesiana para encontrar los mejores parámetros para el algoritmo de segmentación multiresolución (MRS) mientras el modelo de CNN aprende las características de la imagen en diferentes capas, logrando una optimización conjunta. El modelo de clasificación propuesto logró la mejor precisión, con 0.96 OA, 0.95 Kappa y 0.96 mIoU en el área de entrenamiento y 0.97 OA, 0.96 Kappa y 0.97 mIoU en el área de prueba, superando varios métodos de referencia, incluyendo Patch CNN, Center OCNN, Random OCNN y Decision Fusion. El análisis de variantes de CNN dentro del flujo de trabajo de clasificación propuesto mostró que el modelo HybridSN logró los mejores resultados en comparación con CNN 2D y 3D. Las capas de CNN 3D y la combinación de capas de CNN 3D y 2D (HybridSN) produjeron precisiones ligeramente mejores que las capas de CNN 2D en cuanto a fidelidad geométrica, extracción de límites de objetos y separación de objetos adyacentes. La optimización bayesiana pudo encontrar parámetros MRS óptimos comparables para las áreas de entrenamiento y prueba, con una calidad excelente medida por AFI (0.046, -0.037) y QR (0.945, 0.932). En el modelo propuesto, se podrían obtener precisiones más altas con tamaños de parche más grandes (por ejemplo, 9 x 9 en comparación con 3 x 3). Además, el modelo propuesto es computacionalmente eficiente, con el entrenamiento más largo siendo de menos de 25 s considerando todos los subprocesos y una única época de entrenamiento. Como resultado, el modelo propuesto puede ser utilizado para aplicaciones urbanas y ambientales que dependen de imágenes satelitales VHR y requieren información sobre el uso del suelo.