logo móvil
Contáctanos

Aprovechando características profundas para mejorar y preservar la semántica en el hash para recuperación de imágenes

Autores: Zhao, Xusheng; Liu, Jinglei

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Aprovechando características profundas para mejorar y preservar la semántica en el hash para recuperación de imágenes


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Método hash
Código binario
Recuperación de imagen
Capa de mejora de características
Similitud semántica
Pérdida contrastiva

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
El método hash puede convertir datos de alta dimensionalidad en un código binario simple, lo que tiene ventajas de velocidad rápida y pequeña capacidad de almacenamiento en la recuperación de imágenes a gran escala y está siendo gradualmente favorecido por un número creciente de personas. Sin embargo, el método hash tradicional tiene dos deficiencias comunes que afectan la precisión de la recuperación de imágenes. En primer lugar, la mayoría de los métodos hash tradicionales extraen muchas características de imagen irrelevantes, lo que resulta en un sesgo de información parcial en el código binario producido por el método hash. Además, el código binario creado por el método hash tradicional no puede mantener la similitud semántica de la imagen. Para encontrar soluciones a estos dos problemas, probamos una nueva arquitectura de red que agrega una capa de mejora de características para extraer mejor las características de la imagen, eliminar características redundantes y expresar la similitud entre imágenes a través de la pérdida contrastiva, construyendo así un código binario exacto compacto. En resumen, utilizamos la relación entre las etiquetas y las características de la imagen para modelarlas, preservamos mejor la relación semántica y reducimos las características redundantes, y utilizamos una pérdida contrastiva para comparar la similitud entre imágenes, utilizando una pérdida de equilibrio para producir el código binario resultante. El número de 0s y 1s está equilibrado, lo que resulta en un código binario más compacto. Experimentos extensos en tres conjuntos de datos comúnmente utilizados -CIFAR-10, NUS-WIDE y SVHN- muestran que nuestro enfoque (DFEH) puede expresar un buen rendimiento en comparación con los otros enfoques más avanzados.

Otros recursos que podrían interesarte

Temas Virtualpro