Redes neuronales de hashing totalmente conectadas para indexar imágenes de teledetección a gran escala
Autores: Liu, Na; Mou, Haiming; Tang, Jun; Wan, Lihong; Li, Qingdu; Yuan, Ye
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Redes neuronales de hashing totalmente conectadas para indexar imágenes de teledetección a gran escala
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Grandes datos
Consulta de datos
Almacenamiento de datos
Imágenes de teledetección
Red neuronal
Hashing
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Con la aparición de big data, la eficiencia de la consulta de datos y el almacenamiento de datos se ha convertido en un cuello de botella crítico en la comunidad de teledetección. En esta carta, exploramos el aprendizaje de hash para la indexación de imágenes de teledetección a gran escala (RSIs) con una red neuronal supervisada de pares con el objetivo de mejorar el rendimiento de recuperación de RSIs con unos pocos bits binarios. Primero, se propone una red neuronal de hash completamente conectada (FCHNN) para mapear las características de RSI en códigos binarios (de características a binarios). En comparación con los marcos de píxeles a binarios, como DPSH (hashing supervisado de pares profundos), FCHNN solo contiene tres capas completamente conectadas e incorpora otra nueva restricción, por lo que puede acelerarse significativamente para obtener un rendimiento deseable. En segundo lugar, se investigaron cinco tipos de características de imagen, incluidas características de nivel medio y profundas, en el aprendizaje del FCHNN para lograr un rendimiento de vanguardia. Las características de nivel medio se basaron en la codificación de Fisher con descriptores locales afines invariantes, y las características profundas fueron extraídas por CNN preentrenadas o finamente ajustadas (por ejemplo, CaffeNet y VGG-VD16). Los experimentos en cinco conjuntos de datos de RSI a gran escala recientemente lanzados (es decir, AID, NWPU45, PatternNet, RSI-CB128 y RSI-CB256) demostraron la efectividad del método propuesto en comparación con los métodos de hashing existentes basados en técnicas manuales o profundas.
Descripción
Con la aparición de big data, la eficiencia de la consulta de datos y el almacenamiento de datos se ha convertido en un cuello de botella crítico en la comunidad de teledetección. En esta carta, exploramos el aprendizaje de hash para la indexación de imágenes de teledetección a gran escala (RSIs) con una red neuronal supervisada de pares con el objetivo de mejorar el rendimiento de recuperación de RSIs con unos pocos bits binarios. Primero, se propone una red neuronal de hash completamente conectada (FCHNN) para mapear las características de RSI en códigos binarios (de características a binarios). En comparación con los marcos de píxeles a binarios, como DPSH (hashing supervisado de pares profundos), FCHNN solo contiene tres capas completamente conectadas e incorpora otra nueva restricción, por lo que puede acelerarse significativamente para obtener un rendimiento deseable. En segundo lugar, se investigaron cinco tipos de características de imagen, incluidas características de nivel medio y profundas, en el aprendizaje del FCHNN para lograr un rendimiento de vanguardia. Las características de nivel medio se basaron en la codificación de Fisher con descriptores locales afines invariantes, y las características profundas fueron extraídas por CNN preentrenadas o finamente ajustadas (por ejemplo, CaffeNet y VGG-VD16). Los experimentos en cinco conjuntos de datos de RSI a gran escala recientemente lanzados (es decir, AID, NWPU45, PatternNet, RSI-CB128 y RSI-CB256) demostraron la efectividad del método propuesto en comparación con los métodos de hashing existentes basados en técnicas manuales o profundas.