Mask2Former con una consulta mejorada para la segmentación semántica en imágenes de teledetección
Autores: Guo, Shichen; Yang, Qi; Xiang, Shiming; Wang, Shuwen; Wang, Xuezhi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mask2Former con una consulta mejorada para la segmentación semántica en imágenes de teledetección
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Segmentación semántica
Imágenes de teledetección
Mask2Former
IQ2Former
Módulo de escenario de consulta
Módulo de atención de consulta
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La segmentación semántica de imágenes de teledetección (RS) es vital en varias aplicaciones prácticas, incluida la planificación de la construcción urbana, el monitoreo de desastres naturales y la investigación de recursos terrestres. Sin embargo, las imágenes de RS son capturadas por aviones o satélites a altitudes elevadas y largas distancias, lo que resulta en objetos terrestres de la misma categoría dispersos en varios rincones de la imagen. Además, objetos de diferentes tamaños aparecen simultáneamente en las imágenes de RS. Por ejemplo, algunos objetos ocupan una gran área en escenas urbanas, mientras que otros solo tienen regiones pequeñas. Técnicamente, las dos situaciones universales anteriores plantean desafíos significativos para la segmentación con alta calidad de las imágenes de RS. Basándose en estas observaciones, este documento propone un Mask2Former con una consulta mejorada (IQ2Former) para esta tarea.
Descripción
La segmentación semántica de imágenes de teledetección (RS) es vital en varias aplicaciones prácticas, incluida la planificación de la construcción urbana, el monitoreo de desastres naturales y la investigación de recursos terrestres. Sin embargo, las imágenes de RS son capturadas por aviones o satélites a altitudes elevadas y largas distancias, lo que resulta en objetos terrestres de la misma categoría dispersos en varios rincones de la imagen. Además, objetos de diferentes tamaños aparecen simultáneamente en las imágenes de RS. Por ejemplo, algunos objetos ocupan una gran área en escenas urbanas, mientras que otros solo tienen regiones pequeñas. Técnicamente, las dos situaciones universales anteriores plantean desafíos significativos para la segmentación con alta calidad de las imágenes de RS. Basándose en estas observaciones, este documento propone un Mask2Former con una consulta mejorada (IQ2Former) para esta tarea.