Algoritmo de Recuperación de Imágenes Basado en Hashing Sensible a la Localidad Usando Redes Neuronales Convolucionales y Mecanismo de Atención
Autores: Luo, Youmeng; Li, Wei; Ma, Xiaoyu; Zhang, Kaiqiang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Algoritmo de Recuperación de Imágenes Basado en Hashing Sensible a la Localidad Usando Redes Neuronales Convolucionales y Mecanismo de Atención
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Progreso continuo
Tecnología de recuperación de imágenes
Redes Neuronales Convolucionales
Precisión de recuperación
Hash sensible a la localidad
Mecanismo de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Con el continuo avance de la tecnología de recuperación de imágenes, en el campo de la recuperación de imágenes, la velocidad de búsqueda de una imagen deseada a partir de una gran cantidad de datos de imagen se convierte en un tema candente. Las Redes Neuronales Convolucionales (CNN) se han utilizado en el campo de la recuperación de imágenes. Sin embargo, muchos sistemas de recuperación de imágenes basados en CNN tienen una mala capacidad para expresar las características de las imágenes, lo que resulta en una serie de problemas como baja precisión y robustez en la recuperación. Cuando se recupera la imagen objetivo de una gran cantidad de datos de imagen, la dimensión del vector después de la codificación de la imagen es alta y la eficiencia de recuperación es baja. El hash sensible a la localidad es un método para encontrar datos similares a partir de grandes datos de alta latitud. Reduce la dimensión de los datos espaciales originales a través de la codificación y conversión hash, y también puede mantener la similitud entre los datos. El tiempo de recuperación y la complejidad espacial son bajos. Por lo tanto, este artículo propone un método de recuperación de imágenes basado en hash sensible a la localidad, CNN y el mecanismo de atención. Los pasos del método son los siguientes: utilizar la red ResNet50 como extractor de características de la imagen, agregar el módulo de atención después de la capa de convolución del modelo, y usar la salida de la capa de conexión completa de la red para recuperar las características de la base de datos de imágenes, luego utilizar el algoritmo de hash sensible a la localidad para codificar las características de la imagen de la base de datos para reducir la dimensión y establecer el índice, y finalmente medir las características de la imagen a recuperar y la base de datos de imágenes para obtener la imagen más similar, completando la tarea de recuperación de imágenes basada en contenido. El método en este artículo se compara con otros métodos de recuperación de imágenes en los conjuntos de datos corel1k y corel5k. Los resultados experimentales muestran que este método puede mejorar efectivamente la precisión de la recuperación de imágenes, y la eficiencia de recuperación se mejora significativamente. También tiene una mayor robustez en diferentes escenarios.
Descripción
Con el continuo avance de la tecnología de recuperación de imágenes, en el campo de la recuperación de imágenes, la velocidad de búsqueda de una imagen deseada a partir de una gran cantidad de datos de imagen se convierte en un tema candente. Las Redes Neuronales Convolucionales (CNN) se han utilizado en el campo de la recuperación de imágenes. Sin embargo, muchos sistemas de recuperación de imágenes basados en CNN tienen una mala capacidad para expresar las características de las imágenes, lo que resulta en una serie de problemas como baja precisión y robustez en la recuperación. Cuando se recupera la imagen objetivo de una gran cantidad de datos de imagen, la dimensión del vector después de la codificación de la imagen es alta y la eficiencia de recuperación es baja. El hash sensible a la localidad es un método para encontrar datos similares a partir de grandes datos de alta latitud. Reduce la dimensión de los datos espaciales originales a través de la codificación y conversión hash, y también puede mantener la similitud entre los datos. El tiempo de recuperación y la complejidad espacial son bajos. Por lo tanto, este artículo propone un método de recuperación de imágenes basado en hash sensible a la localidad, CNN y el mecanismo de atención. Los pasos del método son los siguientes: utilizar la red ResNet50 como extractor de características de la imagen, agregar el módulo de atención después de la capa de convolución del modelo, y usar la salida de la capa de conexión completa de la red para recuperar las características de la base de datos de imágenes, luego utilizar el algoritmo de hash sensible a la localidad para codificar las características de la imagen de la base de datos para reducir la dimensión y establecer el índice, y finalmente medir las características de la imagen a recuperar y la base de datos de imágenes para obtener la imagen más similar, completando la tarea de recuperación de imágenes basada en contenido. El método en este artículo se compara con otros métodos de recuperación de imágenes en los conjuntos de datos corel1k y corel5k. Los resultados experimentales muestran que este método puede mejorar efectivamente la precisión de la recuperación de imágenes, y la eficiencia de recuperación se mejora significativamente. También tiene una mayor robustez en diferentes escenarios.