Rslc-deeplab: un método de clasificación de objetos terrestres para imágenes de teledetección de alta resolución
Autores: Yu, Zhimin; Wan, Fang; Lei, Guangbo; Xiong, Ying; Xu, Li; Ye, Zhiwei; Liu, Wei; Zhou, Wen; Xu, Chengzhi
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Rslc-deeplab: un método de clasificación de objetos terrestres para imágenes de teledetección de alta resolución
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Avance
Teledetección
Segmentación semántica
Aprendizaje profundo
Extracción de características
Dependencias espaciales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Con el continuo avance de la tecnología de teledetección, la segmentación semántica de diferentes objetos terrestres en imágenes de teledetección se ha convertido en un tema de investigación activo. Para imágenes de teledetección complejas y diversas, los métodos de aprendizaje profundo tienen la capacidad de discernir automáticamente características de los datos de imagen y capturar complejas dependencias espaciales, superando así a los métodos tradicionales de segmentación de imagen. Para abordar los problemas de baja precisión de segmentación en la segmentación semántica de imágenes de teledetección, este artículo propone una nueva red de segmentación semántica de imágenes de teledetección, RSLC-Deeplab, basada en DeeplabV3+. En primer lugar, se utiliza ResNet-50 como red de extracción de características base, que puede extraer información semántica profunda de manera más efectiva y mejorar la precisión de la segmentación. En segundo lugar, se introduce el mecanismo de atención de coordenadas (CA) en el modelo para mejorar la representación de características generadas por la red al incrustar información de posición en el mecanismo de atención de canales, capturando efectivamente la relación entre la información de posición y los canales. Finalmente, se propone un módulo de fusión de características multinivel (MFF) basado en convolución asimétrica, que captura y refina características espaciales de bajo nivel utilizando convolución asimétrica y luego las fusiona con características abstractas de alto nivel para mitigar la influencia del ruido de fondo y restaurar la información detallada perdida en características profundas. Los resultados experimentales en el conjunto de datos WHDLD muestran que la intersección media sobre unión (mIoU) de RSLC-Deeplab alcanzó el 72.63%, la precisión de píxeles (PA) alcanzó el 83.49%, y la precisión media de píxeles (mPA) alcanzó el 83.72%. En comparación con el DeeplabV3+ original, el método propuesto logró una mejora del 4.13% en mIoU y superó a las redes PSP-NET, U-NET, MACU-NET y DeeplabV3+.
Descripción
Con el continuo avance de la tecnología de teledetección, la segmentación semántica de diferentes objetos terrestres en imágenes de teledetección se ha convertido en un tema de investigación activo. Para imágenes de teledetección complejas y diversas, los métodos de aprendizaje profundo tienen la capacidad de discernir automáticamente características de los datos de imagen y capturar complejas dependencias espaciales, superando así a los métodos tradicionales de segmentación de imagen. Para abordar los problemas de baja precisión de segmentación en la segmentación semántica de imágenes de teledetección, este artículo propone una nueva red de segmentación semántica de imágenes de teledetección, RSLC-Deeplab, basada en DeeplabV3+. En primer lugar, se utiliza ResNet-50 como red de extracción de características base, que puede extraer información semántica profunda de manera más efectiva y mejorar la precisión de la segmentación. En segundo lugar, se introduce el mecanismo de atención de coordenadas (CA) en el modelo para mejorar la representación de características generadas por la red al incrustar información de posición en el mecanismo de atención de canales, capturando efectivamente la relación entre la información de posición y los canales. Finalmente, se propone un módulo de fusión de características multinivel (MFF) basado en convolución asimétrica, que captura y refina características espaciales de bajo nivel utilizando convolución asimétrica y luego las fusiona con características abstractas de alto nivel para mitigar la influencia del ruido de fondo y restaurar la información detallada perdida en características profundas. Los resultados experimentales en el conjunto de datos WHDLD muestran que la intersección media sobre unión (mIoU) de RSLC-Deeplab alcanzó el 72.63%, la precisión de píxeles (PA) alcanzó el 83.49%, y la precisión media de píxeles (mPA) alcanzó el 83.72%. En comparación con el DeeplabV3+ original, el método propuesto logró una mejora del 4.13% en mIoU y superó a las redes PSP-NET, U-NET, MACU-NET y DeeplabV3+.