logo móvil
Contáctanos

Atención Hashing Cruzada Profunda en Dimensiones para Recuperación de Imágenes

Autores: Chao, Zijian; Li, Yongming

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Atención Hashing Cruzada Profunda en Dimensiones para Recuperación de Imágenes


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Tareas de recuperación de imágenes
Métodos de hashing profundo
Extracción de características
Hashing de atención cruzada en múltiples dimensiones
Método DCDAH
ResNet18

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Hoy en día, las vidas de las personas están llenas de una gran cantidad de información visual, y las tareas de recuperación de imágenes son ampliamente necesarias. Los métodos de hashing profundo se utilizan extensamente para gestionar tales demandas debido a su tasa de recuperación y consumo de memoria. Sin embargo, el problema con las técnicas convencionales de recuperación de imágenes mediante hashing profundo es que el contenido semántico de alta dimensión en la imagen no puede ser articulado de manera efectiva debido a la extracción de características insuficiente y desbalanceada. Este documento ofrece el método de hashing de atención cruzada y dimensional profunda (DCDAH) considerando las fallas en la extracción de características, y los puntos importantes de este documento son los siguientes. Este documento propone un módulo de atención cruzada y dimensional (CDA) integrado en ResNet18; el módulo puede capturar la interacción cruzada de los mapas de características para calcular el peso de atención de manera efectiva gracias a su rama especial. Para un mapa de características adquirido por una red neuronal convolucional (CNN), cada rama toma diferentes medidas de rotación y transformaciones residuales para procesarlo. Para evitar que el modelo DCDAH se vuelva demasiado complejo, el módulo CDA está diseñado para tener características de bajo costo computacional. Este documento introduce un esquema para reducir la dimensión de los tensores, lo que puede reducir el cálculo y mantener una representación abundante. Para una dimensión de un mapa de características, se realizan Maxpool y Avgpool, respectivamente, y los dos resultados se conectan. El método DCDAH mejora significativamente el rendimiento de recuperación de imágenes, según estudios sobre los conjuntos de datos CIFAR10 y NUS-WIDE.

Otros recursos que podrían interesarte

Temas Virtualpro