Aprovechando características profundas para mejorar y preservar la semántica en el hash para recuperación de imágenes
Autores: Zhao, Xusheng; Liu, Jinglei
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aprovechando características profundas para mejorar y preservar la semántica en el hash para recuperación de imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Método hash
Código binario
Recuperación de imagen
Capa de mejora de características
Similitud semántica
Pérdida contrastiva
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
El método hash puede convertir datos de alta dimensionalidad en un código binario simple, lo que tiene ventajas de velocidad rápida y pequeña capacidad de almacenamiento en la recuperación de imágenes a gran escala y está siendo gradualmente favorecido por un número creciente de personas. Sin embargo, el método hash tradicional tiene dos deficiencias comunes que afectan la precisión de la recuperación de imágenes. En primer lugar, la mayoría de los métodos hash tradicionales extraen muchas características de imagen irrelevantes, lo que resulta en un sesgo de información parcial en el código binario producido por el método hash. Además, el código binario creado por el método hash tradicional no puede mantener la similitud semántica de la imagen. Para encontrar soluciones a estos dos problemas, probamos una nueva arquitectura de red que agrega una capa de mejora de características para extraer mejor las características de la imagen, eliminar características redundantes y expresar la similitud entre imágenes a través de la pérdida contrastiva, construyendo así un código binario exacto compacto. En resumen, utilizamos la relación entre las etiquetas y las características de la imagen para modelarlas, preservamos mejor la relación semántica y reducimos las características redundantes, y utilizamos una pérdida contrastiva para comparar la similitud entre imágenes, utilizando una pérdida de equilibrio para producir el código binario resultante. El número de 0s y 1s está equilibrado, lo que resulta en un código binario más compacto. Experimentos extensos en tres conjuntos de datos comúnmente utilizados -CIFAR-10, NUS-WIDE y SVHN- muestran que nuestro enfoque (DFEH) puede expresar un buen rendimiento en comparación con los otros enfoques más avanzados.
Descripción
El método hash puede convertir datos de alta dimensionalidad en un código binario simple, lo que tiene ventajas de velocidad rápida y pequeña capacidad de almacenamiento en la recuperación de imágenes a gran escala y está siendo gradualmente favorecido por un número creciente de personas. Sin embargo, el método hash tradicional tiene dos deficiencias comunes que afectan la precisión de la recuperación de imágenes. En primer lugar, la mayoría de los métodos hash tradicionales extraen muchas características de imagen irrelevantes, lo que resulta en un sesgo de información parcial en el código binario producido por el método hash. Además, el código binario creado por el método hash tradicional no puede mantener la similitud semántica de la imagen. Para encontrar soluciones a estos dos problemas, probamos una nueva arquitectura de red que agrega una capa de mejora de características para extraer mejor las características de la imagen, eliminar características redundantes y expresar la similitud entre imágenes a través de la pérdida contrastiva, construyendo así un código binario exacto compacto. En resumen, utilizamos la relación entre las etiquetas y las características de la imagen para modelarlas, preservamos mejor la relación semántica y reducimos las características redundantes, y utilizamos una pérdida contrastiva para comparar la similitud entre imágenes, utilizando una pérdida de equilibrio para producir el código binario resultante. El número de 0s y 1s está equilibrado, lo que resulta en un código binario más compacto. Experimentos extensos en tres conjuntos de datos comúnmente utilizados -CIFAR-10, NUS-WIDE y SVHN- muestran que nuestro enfoque (DFEH) puede expresar un buen rendimiento en comparación con los otros enfoques más avanzados.