Red de atención basada en transformadores para la reidentificación de vehículos
Autores: Lian, Jiawei; Wang, Dahan; Zhu, Shunzhi; Wu, Yun; Li, Caixia
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Red de atención basada en transformadores para la reidentificación de vehículos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reidentificación de vehículos
Detallado
Mecanismos de atención espacial
Red de atención basada en transformadores
Características discriminativas
Rendimiento de última generación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La reidentificación de vehículos (ReID) se centra en buscar imágenes del mismo vehículo en diferentes cámaras y puede considerarse como la tarea de clasificación a nivel de ID más detallada. Es fundamentalmente desafiante debido a las diferencias significativas en la apariencia presentada por un vehículo con el mismo ID (especialmente desde diferentes puntos de vista) junto con las sutiles diferencias entre vehículos con diferentes IDs. Los mecanismos de atención espacial que han demostrado ser efectivos en tareas de visión por computadora también desempeñan un papel importante en la ReID de vehículos. Sin embargo, a menudo requieren etiquetas de puntos clave costosas o sufren de máscaras de atención ruidosas cuando se entrenan sin etiquetas de puntos clave. En este trabajo, proponemos una red de atención basada en transformadores (TAN) para aprender información de atención espacial y facilitar así el aprendizaje de características discriminativas para la ReID de vehículos. Específicamente, en contraste con estudios previos que adoptaron una red de transformadores, diseñamos la red de atención como una rama independiente que puede utilizarse de manera flexible en diversas tareas. Además, combinamos el TAN con otras dos ramas: una para extraer características globales que definen las estructuras a nivel de imagen, y la otra para extraer características auxiliares de atributos laterales que son invariantes al punto de vista, como el color, el tipo de automóvil, etc. Para validar el enfoque propuesto, se realizaron experimentos en dos conjuntos de datos de vehículos (los conjuntos de datos VeRi-776 y VehicleID) y un conjunto de datos de personas (Market-1501). Los resultados experimentales demostraron que el TAN propuesto es efectivo para mejorar el rendimiento tanto en las tareas de ReID de vehículos como de personas, y el método propuesto logra un rendimiento de vanguardia (SOTA).
Descripción
La reidentificación de vehículos (ReID) se centra en buscar imágenes del mismo vehículo en diferentes cámaras y puede considerarse como la tarea de clasificación a nivel de ID más detallada. Es fundamentalmente desafiante debido a las diferencias significativas en la apariencia presentada por un vehículo con el mismo ID (especialmente desde diferentes puntos de vista) junto con las sutiles diferencias entre vehículos con diferentes IDs. Los mecanismos de atención espacial que han demostrado ser efectivos en tareas de visión por computadora también desempeñan un papel importante en la ReID de vehículos. Sin embargo, a menudo requieren etiquetas de puntos clave costosas o sufren de máscaras de atención ruidosas cuando se entrenan sin etiquetas de puntos clave. En este trabajo, proponemos una red de atención basada en transformadores (TAN) para aprender información de atención espacial y facilitar así el aprendizaje de características discriminativas para la ReID de vehículos. Específicamente, en contraste con estudios previos que adoptaron una red de transformadores, diseñamos la red de atención como una rama independiente que puede utilizarse de manera flexible en diversas tareas. Además, combinamos el TAN con otras dos ramas: una para extraer características globales que definen las estructuras a nivel de imagen, y la otra para extraer características auxiliares de atributos laterales que son invariantes al punto de vista, como el color, el tipo de automóvil, etc. Para validar el enfoque propuesto, se realizaron experimentos en dos conjuntos de datos de vehículos (los conjuntos de datos VeRi-776 y VehicleID) y un conjunto de datos de personas (Market-1501). Los resultados experimentales demostraron que el TAN propuesto es efectivo para mejorar el rendimiento tanto en las tareas de ReID de vehículos como de personas, y el método propuesto logra un rendimiento de vanguardia (SOTA).