Aprendizaje no supervisado de hash de pares profundos
Autores: Ma, Ye; Li, Qin; Shi, Xiaoshuang; Guo, Zhenhua
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aprendizaje no supervisado de hash de pares profundos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Hashing profundo no supervisado
Rendimiento
Relación de similitud de pares
Matriz de similitud
Función de pérdida
Bases de datos de referencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Aunque el hashing profundo no supervisado es potencialmente muy útil para abordar muchas tareas a gran escala, su rendimiento todavía está muy por debajo de lo satisfactorio. Además, su rendimiento podría mejorarse significativamente al explotar eficazmente la relación de similitud entre pares entre los datos de entrenamiento, pero la matriz de similitud obtenida suele contener información ruidosa, lo que a menudo disminuye en gran medida el rendimiento del modelo. Para aliviar este problema, en este documento, proponemos un nuevo método de hashing de pares profundos no supervisado para explotar de manera efectiva y robusta la información de similitud entre muestras de entrenamiento y múltiples anclas. Primero creamos una matriz de similitud de pares basada en anclas para mejorar la robustez de las relaciones de similitud y disimilitud entre muestras de entrenamiento y anclas. Posteriormente, proponemos una nueva función de pérdida para aprovechar directa y robustamente la información de similitud y disimilitud a través de una pérdida de entropía cruzada ponderada, y utilizamos una pérdida cuadrada para reducir la brecha entre vectores binarios latentes y códigos binarios, y otra pérdida cuadrada para formar predicciones de consenso de vectores binarios latentes. Experimentos extensos en bases de datos de referencia a gran escala demuestran la efectividad del método propuesto, que supera a los métodos de hashing no supervisados de vanguardia recientes con un rendimiento de clasificación significativamente mejor.
Descripción
Aunque el hashing profundo no supervisado es potencialmente muy útil para abordar muchas tareas a gran escala, su rendimiento todavía está muy por debajo de lo satisfactorio. Además, su rendimiento podría mejorarse significativamente al explotar eficazmente la relación de similitud entre pares entre los datos de entrenamiento, pero la matriz de similitud obtenida suele contener información ruidosa, lo que a menudo disminuye en gran medida el rendimiento del modelo. Para aliviar este problema, en este documento, proponemos un nuevo método de hashing de pares profundos no supervisado para explotar de manera efectiva y robusta la información de similitud entre muestras de entrenamiento y múltiples anclas. Primero creamos una matriz de similitud de pares basada en anclas para mejorar la robustez de las relaciones de similitud y disimilitud entre muestras de entrenamiento y anclas. Posteriormente, proponemos una nueva función de pérdida para aprovechar directa y robustamente la información de similitud y disimilitud a través de una pérdida de entropía cruzada ponderada, y utilizamos una pérdida cuadrada para reducir la brecha entre vectores binarios latentes y códigos binarios, y otra pérdida cuadrada para formar predicciones de consenso de vectores binarios latentes. Experimentos extensos en bases de datos de referencia a gran escala demuestran la efectividad del método propuesto, que supera a los métodos de hashing no supervisados de vanguardia recientes con un rendimiento de clasificación significativamente mejor.