Aprovechando características profundas para mejorar y preservar la semántica en el hash para recuperación de imágenes

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Aprovechando características profundas para mejorar y preservar la semántica en el hash para recuperación de imágenes

Autores: Zhao, Xusheng; Liu, Jinglei

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Aprovechando características profundas para mejorar y preservar la semántica en el hash para recuperación de imágenes

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Método hash

Código binario

Recuperación de imagen

Capa de mejora de características

Similitud semántica

Pérdida contrastiva

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones

El método hash puede convertir datos de alta dimensionalidad en un código binario simple, lo que tiene ventajas de velocidad rápida y pequeña capacidad de almacenamiento en la recuperación de imágenes a gran escala y está siendo gradualmente favorecido por un número creciente de personas. Sin embargo, el método hash tradicional tiene dos deficiencias comunes que afectan la precisión de la recuperación de imágenes. En primer lugar, la mayoría de los métodos hash tradicionales extraen muchas características de imagen irrelevantes, lo que resulta en un sesgo de información parcial en el código binario producido por el método hash. Además, el código binario creado por el método hash tradicional no puede mantener la similitud semántica de la imagen. Para encontrar soluciones a estos dos problemas, probamos una nueva arquitectura de red que agrega una capa de mejora de características para extraer mejor las características de la imagen, eliminar características redundantes y expresar la similitud entre imágenes a través de la pérdida contrastiva, construyendo así un código binario exacto compacto. En resumen, utilizamos la relación entre las etiquetas y las características de la imagen para modelarlas, preservamos mejor la relación semántica y reducimos las características redundantes, y utilizamos una pérdida contrastiva para comparar la similitud entre imágenes, utilizando una pérdida de equilibrio para producir el código binario resultante. El número de 0s y 1s está equilibrado, lo que resulta en un código binario más compacto. Experimentos extensos en tres conjuntos de datos comúnmente utilizados -CIFAR-10, NUS-WIDE y SVHN- muestran que nuestro enfoque (DFEH) puede expresar un buen rendimiento en comparación con los otros enfoques más avanzados.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro