Un eficiente red de atención de múltiples ramas para la reidentificación de personas
Autores: Han, Ke; Zhu, Mingming; Li, Pengzhen; Dong, Jie; Xie, Haoyang; Zhang, Xiyan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un eficiente red de atención de múltiples ramas para la reidentificación de personas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Diseños personalizados
Desafíos
Técnicas de reidentificación de personas
EMANet
Mecanismo de atención
Precisión de identificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
Debido a la ausencia de diseños personalizados que aborden desafíos como variaciones en escala, disparidades en iluminación e instancias de oclusión, la implementación de técnicas actuales de reidentificación de personas sigue siendo desafiante en aplicaciones prácticas. Se propone una Red de Atención de Múltiples Ramas Eficiente sobre OSNet (EMANet). La estructura está compuesta por tres partes, la rama global, la rama relacional y la rama de agrupación de contraste global, y se obtienen características correspondientes de diferentes ramas. Con el mecanismo de atención, que se enfoca en características importantes, la atención DAS evalúa la importancia de las características aprendidas, otorgando calificaciones más altas a aquellas que se consideran cruciales y calificaciones más bajas a aquellas que se consideran distractoras. Este enfoque lleva a una mejora en la precisión de identificación al enfatizar características importantes y descartar la influencia de las distractoras. Se utilizan la pérdida de identidad y la pérdida adaptativa de pares dispersos para facilitar eficientemente la interacción de la información. En experimentos en el conjunto de datos Market-1501, EMANet mostró altas precisiones de identificación del 96.1% y 89.8% para Rank-1 y mAP, respectivamente. Los resultados indican la superioridad y efectividad del modelo propuesto.
Descripción
Debido a la ausencia de diseños personalizados que aborden desafíos como variaciones en escala, disparidades en iluminación e instancias de oclusión, la implementación de técnicas actuales de reidentificación de personas sigue siendo desafiante en aplicaciones prácticas. Se propone una Red de Atención de Múltiples Ramas Eficiente sobre OSNet (EMANet). La estructura está compuesta por tres partes, la rama global, la rama relacional y la rama de agrupación de contraste global, y se obtienen características correspondientes de diferentes ramas. Con el mecanismo de atención, que se enfoca en características importantes, la atención DAS evalúa la importancia de las características aprendidas, otorgando calificaciones más altas a aquellas que se consideran cruciales y calificaciones más bajas a aquellas que se consideran distractoras. Este enfoque lleva a una mejora en la precisión de identificación al enfatizar características importantes y descartar la influencia de las distractoras. Se utilizan la pérdida de identidad y la pérdida adaptativa de pares dispersos para facilitar eficientemente la interacción de la información. En experimentos en el conjunto de datos Market-1501, EMANet mostró altas precisiones de identificación del 96.1% y 89.8% para Rank-1 y mAP, respectivamente. Los resultados indican la superioridad y efectividad del modelo propuesto.