Un estudio de reidentificación de personas ocultas para fusión de características compartidas con segmentación semántica no supervisada y guiada por postura
Autores: Qu, Junsuo; Zhang, Zhenguo; Zhang, Yanghai; He, Chensong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un estudio de reidentificación de personas ocultas para fusión de características compartidas con segmentación semántica no supervisada y guiada por postura
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Oculto
Reidentificación
Red de extracción de características
Guiado por postura
Segmentación semántica no supervisada
Características discriminativas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 47
Citaciones: Sin citaciones
El cuerpo humano suele ser ocultado por una variedad de obstáculos en el sistema de monitoreo, por lo que la reidentificación de personas ocultas sigue siendo un desafío de larga data. Los métodos recientes basados en orientación de postura o pistas semánticas externas han mejorado la representación y el rendimiento relacionado de las características; aún existen problemas, como la representación débil del modelo y pistas semánticas poco confiables. Para resolver los problemas mencionados, propusimos una red de extracción de características, llamada fusión de características compartidas con segmentación semántica no supervisada y guiada por postura (SFPUS). Esta red extraerá características más discriminativas y reducirá el ruido de la oclusión en la coincidencia de peatones. En primer lugar, se utiliza el módulo de extracción de características conjuntas de múltiples ramas (MFE) para extraer conjuntos de características que contienen información de postura e información semántica de alto orden. Este módulo no solo proporciona capacidades de extracción robustas, sino que también puede segmentar con precisión la oclusión y el cuerpo. En segundo lugar, para obtener características discriminativas a escala múltiple, se utiliza el módulo de fusión de coincidencia de características de correlación a escala múltiple (MCF) para hacer coincidir los dos conjuntos de características, y se diseña la Pérdida de Fusión de Postura-Semántica para calcular la similitud de los conjuntos de características entre diferentes modos y fusionarlos en un conjunto de características. En tercer lugar, para resolver el problema de la oclusión de la imagen, utilizamos agrupación en cascada no supervisada para prevenir mejor la interferencia de la oclusión. Finalmente, se comparan los rendimientos del método propuesto y varios métodos existentes en los conjuntos de datos Occluded-Duke, Occluded-ReID, Market-1501 y Duke-MTMC. La precisión de Rango-1 alcanzó el 65.7%, 80.8%, 94.8% y 89.6%, respectivamente, y la precisión de mAP alcanzó el 58.8%, 72.5%, 91.8% y 80.1%. Los resultados del experimento demuestran que nuestro SFPUS propuesto tiene perspectivas prometedoras y se desempeña admirablemente en comparación con los métodos de última generación.
Descripción
El cuerpo humano suele ser ocultado por una variedad de obstáculos en el sistema de monitoreo, por lo que la reidentificación de personas ocultas sigue siendo un desafío de larga data. Los métodos recientes basados en orientación de postura o pistas semánticas externas han mejorado la representación y el rendimiento relacionado de las características; aún existen problemas, como la representación débil del modelo y pistas semánticas poco confiables. Para resolver los problemas mencionados, propusimos una red de extracción de características, llamada fusión de características compartidas con segmentación semántica no supervisada y guiada por postura (SFPUS). Esta red extraerá características más discriminativas y reducirá el ruido de la oclusión en la coincidencia de peatones. En primer lugar, se utiliza el módulo de extracción de características conjuntas de múltiples ramas (MFE) para extraer conjuntos de características que contienen información de postura e información semántica de alto orden. Este módulo no solo proporciona capacidades de extracción robustas, sino que también puede segmentar con precisión la oclusión y el cuerpo. En segundo lugar, para obtener características discriminativas a escala múltiple, se utiliza el módulo de fusión de coincidencia de características de correlación a escala múltiple (MCF) para hacer coincidir los dos conjuntos de características, y se diseña la Pérdida de Fusión de Postura-Semántica para calcular la similitud de los conjuntos de características entre diferentes modos y fusionarlos en un conjunto de características. En tercer lugar, para resolver el problema de la oclusión de la imagen, utilizamos agrupación en cascada no supervisada para prevenir mejor la interferencia de la oclusión. Finalmente, se comparan los rendimientos del método propuesto y varios métodos existentes en los conjuntos de datos Occluded-Duke, Occluded-ReID, Market-1501 y Duke-MTMC. La precisión de Rango-1 alcanzó el 65.7%, 80.8%, 94.8% y 89.6%, respectivamente, y la precisión de mAP alcanzó el 58.8%, 72.5%, 91.8% y 80.1%. Los resultados del experimento demuestran que nuestro SFPUS propuesto tiene perspectivas prometedoras y se desempeña admirablemente en comparación con los métodos de última generación.