Medición de Similitud de Imágenes Profundas Basada en la Red Tripleta Mejorada con Agrupamiento Piramidal Espacial

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Medición de Similitud de Imágenes Profundas Basada en la Red Tripleta Mejorada con Agrupamiento Piramidal Espacial

Autores: Yuan, Xinpan; Liu, Qunfeng; Long, Jun; Hu, Lei; Wang, Yulou

Idioma: Inglés

Editor: MDPI

Año: 2019

Descargar PDF

Acceso abierto

Artículo científico

2019

Medición de Similitud de Imágenes Profundas Basada en la Red Tripleta Mejorada con Agrupamiento Piramidal Espacial

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Medición de similitud de imágenes

Visión por computadora

Red neuronal convolucional

Redes siamesas

Redes de tripletas

Agrupamiento en pirámide espacial

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

La medición de la similitud de imágenes es un problema fundamental en el campo de la visión por computadora. Se utiliza ampliamente en la clasificación de imágenes, la detección de objetos, la recuperación de imágenes y otros campos, principalmente a través de redes siamesas o de tripletas. Estas redes consisten en dos o tres ramas idénticas de redes neuronales convolucionales (CNN) y comparten sus pesos para obtener representaciones de características de imágenes de alto nivel, de modo que las imágenes similares se mapeen cerca unas de otras en el espacio de características, y los pares de imágenes disímiles se mapeen lejos unas de otras. Especialmente, la red de tripletas es conocida como el método más avanzado en la medición de similitud de imágenes. Sin embargo, la CNN básica solo puede manejar imágenes de tamaño fijo. Si obtenemos una imagen de tamaño fijo mediante corte o escalado, se perderá información de la imagen y se reducirá la precisión del reconocimiento. Para resolver el problema, este artículo ha propuesto la red de agrupamiento en pirámide espacial de tripletas (TSPP-Net) mediante la combinación de la red neuronal convolucional de tripletas con el agrupamiento en pirámide espacial. Además, proponemos una función de pérdida de tripletas mejorada, de modo que el modelo de red pueda realizar un aprendizaje de distancia doble al ingresar solo tres muestras a la vez. A través del análisis teórico y experimentos, se ha demostrado que el modelo TSPP-Net y la función de pérdida triple mejorada pueden mejorar la capacidad de generalización y la precisión del algoritmo de medición de similitud de imágenes.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro