Top posición sensible relación ordinal preservando peso bitwise para recuperación de imágenes
Autores: Wang, Zhen; Sun, Fuzhen; Zhang, Longbo; Wang, Lei; Liu, Pingping
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Top posición sensible relación ordinal preservando peso bitwise para recuperación de imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Codificación binaria
Vecinos más cercanos aproximados
Distancia de Hamming
Relación ordinal
Pesos de bits
Optimización iterativa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
En los últimos años, los métodos de codificación binaria se han vuelto cada vez más populares para tareas de búsqueda de vecinos más cercanos aproximados (ANNs). Los datos de alta dimensión pueden ser cuantificados en códigos binarios para proporcionar una aproximación eficiente de similitud a través de una distancia de Hamming. Sin embargo, la mayoría de los esquemas existentes consideran la importancia de cada bit binario como igual y tratan las muestras de entrenamiento en diferentes posiciones de manera igual, lo que provoca que muchas parejas de datos compartan la misma distancia de Hamming y una pérdida de recuperación más grande en la posición superior. Para abordar estos problemas, proponemos un método novedoso denominado método de peso de bits de preservación de relación ordinal sensible a la posición superior (TORBW). La idea principal es penalizar los puntos de datos sin preservar una relación ordinal en la posición superior de una lista de clasificación más que aquellos en la parte inferior y asignar diferentes valores de peso a sus bits binarios de acuerdo con la distribución de datos de consulta. Específicamente, diseñamos un mecanismo de optimización iterativo para aprender simultáneamente códigos binarios y pesos de bits, lo que hace que sus procesos de aprendizaje estén relacionados entre sí. Cuando el procedimiento iterativo converge, los códigos binarios y los pesos de bits se adaptan efectivamente entre sí. Para reducir la complejidad del entrenamiento, relajamos las restricciones discretas tanto de los códigos binarios como de la función indicadora. Además, preentrenamos un grafo ordinal tensorial para disminuir el consumo de tiempo de calcular una relación de similitud relativa entre puntos de datos. Los resultados experimentales en tres conjuntos de datos de referencia de búsqueda de ANN a gran escala, es decir, SIFT1M, GIST1M y Cifar10, muestran que el método TORBW propuesto puede lograr un rendimiento superior sobre los enfoques de vanguardia.
Descripción
En los últimos años, los métodos de codificación binaria se han vuelto cada vez más populares para tareas de búsqueda de vecinos más cercanos aproximados (ANNs). Los datos de alta dimensión pueden ser cuantificados en códigos binarios para proporcionar una aproximación eficiente de similitud a través de una distancia de Hamming. Sin embargo, la mayoría de los esquemas existentes consideran la importancia de cada bit binario como igual y tratan las muestras de entrenamiento en diferentes posiciones de manera igual, lo que provoca que muchas parejas de datos compartan la misma distancia de Hamming y una pérdida de recuperación más grande en la posición superior. Para abordar estos problemas, proponemos un método novedoso denominado método de peso de bits de preservación de relación ordinal sensible a la posición superior (TORBW). La idea principal es penalizar los puntos de datos sin preservar una relación ordinal en la posición superior de una lista de clasificación más que aquellos en la parte inferior y asignar diferentes valores de peso a sus bits binarios de acuerdo con la distribución de datos de consulta. Específicamente, diseñamos un mecanismo de optimización iterativo para aprender simultáneamente códigos binarios y pesos de bits, lo que hace que sus procesos de aprendizaje estén relacionados entre sí. Cuando el procedimiento iterativo converge, los códigos binarios y los pesos de bits se adaptan efectivamente entre sí. Para reducir la complejidad del entrenamiento, relajamos las restricciones discretas tanto de los códigos binarios como de la función indicadora. Además, preentrenamos un grafo ordinal tensorial para disminuir el consumo de tiempo de calcular una relación de similitud relativa entre puntos de datos. Los resultados experimentales en tres conjuntos de datos de referencia de búsqueda de ANN a gran escala, es decir, SIFT1M, GIST1M y Cifar10, muestran que el método TORBW propuesto puede lograr un rendimiento superior sobre los enfoques de vanguardia.