La codificación hash de similitud múltiple profunda con aprendizaje mejorado espacial para la recuperación de imágenes de teledetección
Autores: Zhang, Huihui; Qin, Qibing; Ge, Meiling; Huang, Jianyong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
La codificación hash de similitud múltiple profunda con aprendizaje mejorado espacial para la recuperación de imágenes de teledetección
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Recuperación de imágenes por teledetección
Hash profundo
Fondos no relevantes para el contenido
Características detalladas
Aprendizaje de hash
Aprendizaje de mejora espacial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
La recuperación de imágenes de teledetección (RSIR) desempeña un papel crucial en las aplicaciones de teledetección, centrándose en recuperar una colección de elementos que se asemejen estrechamente a una imagen de consulta especificada. Debido a las ventajas de bajo costo de almacenamiento y rápida velocidad de búsqueda, el hashing profundo ha sido uno de los problemas de investigación más activos en la recuperación de imágenes de teledetección. Sin embargo, las imágenes de teledetección contienen muchos fondos o ruidos no relevantes para el contenido, y a menudo carecen de la capacidad para capturar características esenciales detalladas. Además, el aprendizaje de hash existente a menudo se basa en estrategias de muestreo aleatorio o minería de negativos semi-duros para formar lotes de entrenamiento, lo que podría ser abrumado por algunos pares redundantes que ralentizan la convergencia del modelo y comprometen el rendimiento de la recuperación. Para resolver estos problemas de manera efectiva, se propone un novedoso Hashing de Multi-similitud Profunda con Aprendizaje Mejorado Espacial, denominado DMsH-SL, para aprender descriptores binarios compactos pero discriminatorios para la recuperación de imágenes de teledetección. Específicamente, para suprimir la información interferente y localizar con precisión la ubicación objetivo, al introducir un mecanismo de aprendizaje de mejora espacial, se diseña primero la red jerárquica mejorada por grupos espaciales para aprender la distribución espacial de diferentes subcaracterísticas semánticas, capturando la representación de incrustación semántica resistente al ruido. Además, para explorar completamente las relaciones de similitud de los puntos de datos en el espacio de incrustación, se propone la pérdida de multi-similitud para construir lotes de entrenamiento informativos y representativos, que se basa en la minería y ponderación por pares para calcular la auto-similitud y similitud relativa de los pares de imágenes, mitigando efectivamente los efectos de los pares redundantes y desequilibrados. Los resultados experimentales en tres conjuntos de datos de referencia validan el rendimiento superior de nuestro enfoque.
Descripción
La recuperación de imágenes de teledetección (RSIR) desempeña un papel crucial en las aplicaciones de teledetección, centrándose en recuperar una colección de elementos que se asemejen estrechamente a una imagen de consulta especificada. Debido a las ventajas de bajo costo de almacenamiento y rápida velocidad de búsqueda, el hashing profundo ha sido uno de los problemas de investigación más activos en la recuperación de imágenes de teledetección. Sin embargo, las imágenes de teledetección contienen muchos fondos o ruidos no relevantes para el contenido, y a menudo carecen de la capacidad para capturar características esenciales detalladas. Además, el aprendizaje de hash existente a menudo se basa en estrategias de muestreo aleatorio o minería de negativos semi-duros para formar lotes de entrenamiento, lo que podría ser abrumado por algunos pares redundantes que ralentizan la convergencia del modelo y comprometen el rendimiento de la recuperación. Para resolver estos problemas de manera efectiva, se propone un novedoso Hashing de Multi-similitud Profunda con Aprendizaje Mejorado Espacial, denominado DMsH-SL, para aprender descriptores binarios compactos pero discriminatorios para la recuperación de imágenes de teledetección. Específicamente, para suprimir la información interferente y localizar con precisión la ubicación objetivo, al introducir un mecanismo de aprendizaje de mejora espacial, se diseña primero la red jerárquica mejorada por grupos espaciales para aprender la distribución espacial de diferentes subcaracterísticas semánticas, capturando la representación de incrustación semántica resistente al ruido. Además, para explorar completamente las relaciones de similitud de los puntos de datos en el espacio de incrustación, se propone la pérdida de multi-similitud para construir lotes de entrenamiento informativos y representativos, que se basa en la minería y ponderación por pares para calcular la auto-similitud y similitud relativa de los pares de imágenes, mitigando efectivamente los efectos de los pares redundantes y desequilibrados. Los resultados experimentales en tres conjuntos de datos de referencia validan el rendimiento superior de nuestro enfoque.