Glocal retriever: recuperación de imágenes glocal utilizando la combinación de descriptores globales y locales
Autores: Kim, Zeu; Kim, Youngin; Suh, Young-Joo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Glocal retriever: recuperación de imágenes glocal utilizando la combinación de descriptores globales y locales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Visión por computadora
Aprendizaje métrico
Redes neuronales convolucionales
Recuperación de imágenes
Descriptores globales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 52
Citaciones: Sin citaciones
El desarrollo del aprendizaje profundo ha llevado al progreso en la visión por computadora, incluyendo tareas de aprendizaje métrico como la recuperación de imágenes, a través de redes neuronales convolucionales. En la recuperación de imágenes, la distancia métrica (es decir, la similitud) entre las imágenes debe ser calculada y luego comparada para devolver imágenes similares. Los descriptores globales son buenos para extraer características holísticas de una imagen, como la forma general del objeto principal y la silueta. Por otro lado, las características locales extraen las características detalladas que el modelo utiliza para ayudar a clasificar imágenes similares juntas. Este documento propone un mezclador de descriptores que aprovecha tanto descriptores locales como globales (grupo de características combinadas en una) así como diferentes tipos de descriptores globales para un efecto de una versión más ligera de un conjunto de modelos (es decir, menos parámetros y un tamaño de modelo más pequeño que los de un conjunto real de redes). Como resultado, el rendimiento del modelo mejoró alrededor de un 1.36% (recall @ 32) cuando se usó la combinación de los descriptores. Empíricamente descubrimos que la combinación de GeM y MAC logró el mejor rendimiento.
Descripción
El desarrollo del aprendizaje profundo ha llevado al progreso en la visión por computadora, incluyendo tareas de aprendizaje métrico como la recuperación de imágenes, a través de redes neuronales convolucionales. En la recuperación de imágenes, la distancia métrica (es decir, la similitud) entre las imágenes debe ser calculada y luego comparada para devolver imágenes similares. Los descriptores globales son buenos para extraer características holísticas de una imagen, como la forma general del objeto principal y la silueta. Por otro lado, las características locales extraen las características detalladas que el modelo utiliza para ayudar a clasificar imágenes similares juntas. Este documento propone un mezclador de descriptores que aprovecha tanto descriptores locales como globales (grupo de características combinadas en una) así como diferentes tipos de descriptores globales para un efecto de una versión más ligera de un conjunto de modelos (es decir, menos parámetros y un tamaño de modelo más pequeño que los de un conjunto real de redes). Como resultado, el rendimiento del modelo mejoró alrededor de un 1.36% (recall @ 32) cuando se usó la combinación de los descriptores. Empíricamente descubrimos que la combinación de GeM y MAC logró el mejor rendimiento.