logo móvil
Contáctanos

Medición de Similitud de Imágenes Profundas Basada en la Red Tripleta Mejorada con Agrupamiento Piramidal Espacial

Autores: Yuan, Xinpan; Liu, Qunfeng; Long, Jun; Hu, Lei; Wang, Yulou

Idioma: Inglés

Editor: MDPI

Año: 2019

Descargar PDF

Acceso abierto

Artículo científico
2019

Medición de Similitud de Imágenes Profundas Basada en la Red Tripleta Mejorada con Agrupamiento Piramidal Espacial


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Medición de similitud de imágenes
Visión por computadora
Red neuronal convolucional
Redes siamesas
Redes de tripletas
Agrupamiento en pirámide espacial

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La medición de la similitud de imágenes es un problema fundamental en el campo de la visión por computadora. Se utiliza ampliamente en la clasificación de imágenes, la detección de objetos, la recuperación de imágenes y otros campos, principalmente a través de redes siamesas o de tripletas. Estas redes consisten en dos o tres ramas idénticas de redes neuronales convolucionales (CNN) y comparten sus pesos para obtener representaciones de características de imágenes de alto nivel, de modo que las imágenes similares se mapeen cerca unas de otras en el espacio de características, y los pares de imágenes disímiles se mapeen lejos unas de otras. Especialmente, la red de tripletas es conocida como el método más avanzado en la medición de similitud de imágenes. Sin embargo, la CNN básica solo puede manejar imágenes de tamaño fijo. Si obtenemos una imagen de tamaño fijo mediante corte o escalado, se perderá información de la imagen y se reducirá la precisión del reconocimiento. Para resolver el problema, este artículo ha propuesto la red de agrupamiento en pirámide espacial de tripletas (TSPP-Net) mediante la combinación de la red neuronal convolucional de tripletas con el agrupamiento en pirámide espacial. Además, proponemos una función de pérdida de tripletas mejorada, de modo que el modelo de red pueda realizar un aprendizaje de distancia doble al ingresar solo tres muestras a la vez. A través del análisis teórico y experimentos, se ha demostrado que el modelo TSPP-Net y la función de pérdida triple mejorada pueden mejorar la capacidad de generalización y la precisión del algoritmo de medición de similitud de imágenes.

Otros recursos que podrían interesarte

Temas Virtualpro