Aprendizaje de características conjunto de múltiples niveles para la reidentificación de personas
Autores: Wu, Shaojun; Gao, Ling
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Aprendizaje de características conjunto de múltiples niveles para la reidentificación de personas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Características de imagen
Imágenes de peatones
Redes de aprendizaje profundo
Características locales
Características globales
Reidentificación de personas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
En la reidentificación de personas, extraer características de imagen es un paso importante al recuperar imágenes de peatones. La mayoría de los métodos actuales solo extraen características globales o características locales de imágenes de peatones. Al aprender características de imagen, algunos detalles poco llamativos son fácilmente ignorados, lo que no es eficiente ni robusto para escenarios con grandes diferencias. En este documento, proponemos un modelo de Fusión de Características Multinivel que combina tanto características globales como locales de imágenes a través de redes de aprendizaje profundo para generar descriptores de peatones más discriminativos. Específicamente, extraemos características locales de diferentes profundidades de la red mediante la Red Multinivel Basada en Partes para fusionar características locales de bajo a alto nivel de imágenes de peatones. Se utilizan Ramas Global-Locales para extraer las características locales y globales en el nivel más alto. Los experimentos han demostrado que nuestro modelo de aprendizaje profundo basado en la fusión de características multinivel funciona bien en la reidentificación de personas. Los resultados generales superan el estado del arte con márgenes considerables en tres conjuntos de datos ampliamente utilizados. Por ejemplo, logramos una precisión de 96% en el puesto 1 en el conjunto de datos Market-1501 y un mAP del 76,1% en el conjunto de datos DukeMTMC-reID, superando ampliamente los trabajos existentes (más del 6%).
Descripción
En la reidentificación de personas, extraer características de imagen es un paso importante al recuperar imágenes de peatones. La mayoría de los métodos actuales solo extraen características globales o características locales de imágenes de peatones. Al aprender características de imagen, algunos detalles poco llamativos son fácilmente ignorados, lo que no es eficiente ni robusto para escenarios con grandes diferencias. En este documento, proponemos un modelo de Fusión de Características Multinivel que combina tanto características globales como locales de imágenes a través de redes de aprendizaje profundo para generar descriptores de peatones más discriminativos. Específicamente, extraemos características locales de diferentes profundidades de la red mediante la Red Multinivel Basada en Partes para fusionar características locales de bajo a alto nivel de imágenes de peatones. Se utilizan Ramas Global-Locales para extraer las características locales y globales en el nivel más alto. Los experimentos han demostrado que nuestro modelo de aprendizaje profundo basado en la fusión de características multinivel funciona bien en la reidentificación de personas. Los resultados generales superan el estado del arte con márgenes considerables en tres conjuntos de datos ampliamente utilizados. Por ejemplo, logramos una precisión de 96% en el puesto 1 en el conjunto de datos Market-1501 y un mAP del 76,1% en el conjunto de datos DukeMTMC-reID, superando ampliamente los trabajos existentes (más del 6%).