Atención Hashing Cruzada Profunda en Dimensiones para Recuperación de Imágenes
Autores: Chao, Zijian; Li, Yongming
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Atención Hashing Cruzada Profunda en Dimensiones para Recuperación de Imágenes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Tareas de recuperación de imágenes
Métodos de hashing profundo
Extracción de características
Hashing de atención cruzada en múltiples dimensiones
Método DCDAH
ResNet18
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Hoy en día, las vidas de las personas están llenas de una gran cantidad de información visual, y las tareas de recuperación de imágenes son ampliamente necesarias. Los métodos de hashing profundo se utilizan extensamente para gestionar tales demandas debido a su tasa de recuperación y consumo de memoria. Sin embargo, el problema con las técnicas convencionales de recuperación de imágenes mediante hashing profundo es que el contenido semántico de alta dimensión en la imagen no puede ser articulado de manera efectiva debido a la extracción de características insuficiente y desbalanceada. Este documento ofrece el método de hashing de atención cruzada y dimensional profunda (DCDAH) considerando las fallas en la extracción de características, y los puntos importantes de este documento son los siguientes. Este documento propone un módulo de atención cruzada y dimensional (CDA) integrado en ResNet18; el módulo puede capturar la interacción cruzada de los mapas de características para calcular el peso de atención de manera efectiva gracias a su rama especial. Para un mapa de características adquirido por una red neuronal convolucional (CNN), cada rama toma diferentes medidas de rotación y transformaciones residuales para procesarlo. Para evitar que el modelo DCDAH se vuelva demasiado complejo, el módulo CDA está diseñado para tener características de bajo costo computacional. Este documento introduce un esquema para reducir la dimensión de los tensores, lo que puede reducir el cálculo y mantener una representación abundante. Para una dimensión de un mapa de características, se realizan Maxpool y Avgpool, respectivamente, y los dos resultados se conectan. El método DCDAH mejora significativamente el rendimiento de recuperación de imágenes, según estudios sobre los conjuntos de datos CIFAR10 y NUS-WIDE.
Descripción
Hoy en día, las vidas de las personas están llenas de una gran cantidad de información visual, y las tareas de recuperación de imágenes son ampliamente necesarias. Los métodos de hashing profundo se utilizan extensamente para gestionar tales demandas debido a su tasa de recuperación y consumo de memoria. Sin embargo, el problema con las técnicas convencionales de recuperación de imágenes mediante hashing profundo es que el contenido semántico de alta dimensión en la imagen no puede ser articulado de manera efectiva debido a la extracción de características insuficiente y desbalanceada. Este documento ofrece el método de hashing de atención cruzada y dimensional profunda (DCDAH) considerando las fallas en la extracción de características, y los puntos importantes de este documento son los siguientes. Este documento propone un módulo de atención cruzada y dimensional (CDA) integrado en ResNet18; el módulo puede capturar la interacción cruzada de los mapas de características para calcular el peso de atención de manera efectiva gracias a su rama especial. Para un mapa de características adquirido por una red neuronal convolucional (CNN), cada rama toma diferentes medidas de rotación y transformaciones residuales para procesarlo. Para evitar que el modelo DCDAH se vuelva demasiado complejo, el módulo CDA está diseñado para tener características de bajo costo computacional. Este documento introduce un esquema para reducir la dimensión de los tensores, lo que puede reducir el cálculo y mantener una representación abundante. Para una dimensión de un mapa de características, se realizan Maxpool y Avgpool, respectivamente, y los dos resultados se conectan. El método DCDAH mejora significativamente el rendimiento de recuperación de imágenes, según estudios sobre los conjuntos de datos CIFAR10 y NUS-WIDE.