logo móvil
Contáctanos

Red de Segmentación Semántica Basada en Multiatención para Imágenes de Teledetección de Cobertura Terrestre

Autores: Jia, Jintong; Song, Jiarui; Kong, Qingqiang; Yang, Huan; Teng, Yunhe; Song, Xuan

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Red de Segmentación Semántica Basada en Multiatención para Imágenes de Teledetección de Cobertura Terrestre


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Segmentación semántica
Imágenes de teledetección
Red basada en atención
UNet
Extracción de características
Problema a múltiples escalas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones


Descripción
La segmentación semántica es una tecnología clave para el análisis de imágenes de teledetección ampliamente utilizada en la clasificación de cobertura terrestre, monitoreo de desastres naturales y otros campos. A diferencia de la segmentación de imágenes tradicional, en las imágenes de teledetección hay varios objetivos, con una gran diferencia de características entre ellos. Como resultado, la segmentación es más difícil y los modelos existentes mantienen una baja precisión y una segmentación de bordes inexacta cuando se utilizan en imágenes de teledetección. Este artículo propone una red de segmentación semántica basada en múltiples atenciones para imágenes de teledetección con el fin de abordar estos problemas. Específicamente, elegimos UNet como modelo base, utilizando una red residual basada en atención de coordenadas en el codificador para mejorar la capacidad de extracción de características de la red base para características detalladas. Utilizamos un módulo de reorganización consciente del contenido en el decodificador para reemplazar el operador de aumento de muestreo tradicional y mejorar la capacidad de extracción de información de la red, y, además, proponemos un módulo de atención fusionada para la fusión de mapas de características después del aumento de muestreo, con el objetivo de resolver el problema de múltiples escalas. Evaluamos nuestro modelo propuesto en el conjunto de datos WHDLD y en nuestro conjunto de datos de Lu County autoetiquetado. El modelo logró un mIOU del 63.27% y 72.83%, y un mPA del 74.86% y 84.72%, respectivamente. A través de la comparación y el análisis de la matriz de confusión, nuestro modelo superó a los modelos de referencia comúnmente utilizados en ambos conjuntos de datos.

Otros recursos que podrían interesarte

Temas Virtualpro