La reidentificación de personas a través de características multipartes en forma de pirámide y un marco de trabajo de multiatención

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

La reidentificación de personas a través de características multipartes en forma de pirámide y un marco de trabajo de multiatención

Autores: Bayoumi, Randa Mohamed; Hemayed, Elsayed E.; Ragab, Mohammad Ehab; Fayek, Magda B.

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

La reidentificación de personas a través de características multipartes en forma de pirámide y un marco de trabajo de multiatención

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Video

Identificación de personas

Atención

Características

CNN

Conjunto de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 36

Citaciones: Sin citaciones

La identificación de personas basada en video se ha vuelto bastante atractiva debido a su importancia en muchos problemas de vigilancia visual. Es un tema desafiante debido a los cambios inter/intra, la oclusión y las variaciones de pose involucradas. En este documento, proponemos un marco atento a la pirámide que se basa en características de múltiples partes y múltiples atenciones para agregar características de múltiples niveles y aprender representaciones basadas en la atención de personas a través de varios aspectos. Se utiliza la auto-atención para fortalecer las características más discriminativas en los dominios espaciales y de canal y capturar así información global robusta. Proponemos el uso de la atención de relación de partes entre diferentes representaciones de características de multi-granularidad para centrarse en el aprendizaje de características locales apropiadas. Se utiliza la atención temporal para agregar características temporales. Integramos las características más robustas en las vistas globales y de múltiples niveles para construir un modelo efectivo de red neuronal convolucional (CNN). El modelo propuesto supera a los modelos anteriores de vanguardia en tres conjuntos de datos. Especialmente, el uso del modelo propuesto permite alcanzar un 98.9% (una mejora relativa del 2.7% en el GRL) de precisión top1 y un 99.3% de mAP en el PRID2011, y un 92.8% (una mejora relativa del 2.4% en relación al GRL) de precisión top1 en iLIDS-vid. También exploramos la capacidad de generalización de nuestro modelo en un conjunto de datos cruzado.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro