logo móvil
Contáctanos

La reidentificación de personas a través de características multipartes en forma de pirámide y un marco de trabajo de multiatención

Autores: Bayoumi, Randa Mohamed; Hemayed, Elsayed E.; Ragab, Mohammad Ehab; Fayek, Magda B.

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

La reidentificación de personas a través de características multipartes en forma de pirámide y un marco de trabajo de multiatención


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Video
Identificación de personas
Atención
Características
CNN
Conjunto de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 36

Citaciones: Sin citaciones


Descripción
La identificación de personas basada en video se ha vuelto bastante atractiva debido a su importancia en muchos problemas de vigilancia visual. Es un tema desafiante debido a los cambios inter/intra, la oclusión y las variaciones de pose involucradas. En este documento, proponemos un marco atento a la pirámide que se basa en características de múltiples partes y múltiples atenciones para agregar características de múltiples niveles y aprender representaciones basadas en la atención de personas a través de varios aspectos. Se utiliza la auto-atención para fortalecer las características más discriminativas en los dominios espaciales y de canal y capturar así información global robusta. Proponemos el uso de la atención de relación de partes entre diferentes representaciones de características de multi-granularidad para centrarse en el aprendizaje de características locales apropiadas. Se utiliza la atención temporal para agregar características temporales. Integramos las características más robustas en las vistas globales y de múltiples niveles para construir un modelo efectivo de red neuronal convolucional (CNN). El modelo propuesto supera a los modelos anteriores de vanguardia en tres conjuntos de datos. Especialmente, el uso del modelo propuesto permite alcanzar un 98.9% (una mejora relativa del 2.7% en el GRL) de precisión top1 y un 99.3% de mAP en el PRID2011, y un 92.8% (una mejora relativa del 2.4% en relación al GRL) de precisión top1 en iLIDS-vid. También exploramos la capacidad de generalización de nuestro modelo en un conjunto de datos cruzado.

Otros recursos que podrían interesarte

Temas Virtualpro