Algoritmo de reidentificación de personas de doble rama basado en representación de múltiples características
Autores: Cui, Xinyu; Liang, Yu; Zhang, Wei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Algoritmo de reidentificación de personas de doble rama basado en representación de múltiples características
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Persona
Reidentificación
Peatones
Información
Características
Algoritmo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
La reidentificación de personas puede identificar peatones específicos a través de cámaras y resolver las limitaciones visuales de una sola escena de cámara fija. Alcanza el análisis de trayectorias de peatones objetivo, facilitando el análisis de casos por parte del personal de seguridad pública. La reidentificación de personas se ha convertido en un problema desafiante debido a la oclusión, el desenfoque, el cambio de postura, etc. La clave para afectar la precisión es si se puede obtener suficiente información de los peatones. La mayoría de los métodos de aprendizaje profundo existentes solo consideran una sola categoría de características, lo que resulta en problemas de pérdida de información y expresión de características únicas. Este artículo propuso un algoritmo de reidentificación de personas de doble rama basado en ramas de múltiples escalas y granularidades para obtener información completa de peatones, llamado MSMG-Net. La rama de múltiples escalas extrajo características de diferentes capas y las fusionó a través de la estructura piramidal cruzada bidireccional. Compensó la pérdida de información causada por el uso solo de características semánticas de alto nivel. La rama de múltiples granularidades combinó la red neuronal convolucional (CNN) y el módulo Transformer basado en mecanismos de autoatención mejorados para obtener información global, y realizó una segmentación horizontal de mapas de características para obtener información local. Combinó características globales y locales y resolvió el problema de la expresión de características únicas. Los resultados experimentales muestran que el mAP/Rango-1 de MSMG-Net alcanzó 88.6%/96.3% en el conjunto de datos Market-1501 y 80.1%/89.9% en el conjunto de datos DukeMTMC-ReID. En comparación con muchos métodos de vanguardia, el rendimiento del algoritmo propuesto mejoró significativamente.
Descripción
La reidentificación de personas puede identificar peatones específicos a través de cámaras y resolver las limitaciones visuales de una sola escena de cámara fija. Alcanza el análisis de trayectorias de peatones objetivo, facilitando el análisis de casos por parte del personal de seguridad pública. La reidentificación de personas se ha convertido en un problema desafiante debido a la oclusión, el desenfoque, el cambio de postura, etc. La clave para afectar la precisión es si se puede obtener suficiente información de los peatones. La mayoría de los métodos de aprendizaje profundo existentes solo consideran una sola categoría de características, lo que resulta en problemas de pérdida de información y expresión de características únicas. Este artículo propuso un algoritmo de reidentificación de personas de doble rama basado en ramas de múltiples escalas y granularidades para obtener información completa de peatones, llamado MSMG-Net. La rama de múltiples escalas extrajo características de diferentes capas y las fusionó a través de la estructura piramidal cruzada bidireccional. Compensó la pérdida de información causada por el uso solo de características semánticas de alto nivel. La rama de múltiples granularidades combinó la red neuronal convolucional (CNN) y el módulo Transformer basado en mecanismos de autoatención mejorados para obtener información global, y realizó una segmentación horizontal de mapas de características para obtener información local. Combinó características globales y locales y resolvió el problema de la expresión de características únicas. Los resultados experimentales muestran que el mAP/Rango-1 de MSMG-Net alcanzó 88.6%/96.3% en el conjunto de datos Market-1501 y 80.1%/89.9% en el conjunto de datos DukeMTMC-ReID. En comparación con muchos métodos de vanguardia, el rendimiento del algoritmo propuesto mejoró significativamente.