Escalado-invariante Max-Filtering Enhancement Transformers para un seguimiento visual eficiente
Autores: Chen, Zhen; Xiong, Xingzhong; Meng, Fanqin; Xiao, Xianbing; Liu, Jun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Escalado-invariante Max-Filtering Enhancement Transformers para un seguimiento visual eficiente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Seguimiento en tiempo real
Visión por computadora
Rastreadores basados en transformadores
AnteaTrack
Operador de filtrado máximo
Pixel-Shuffle
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El seguimiento en tiempo real es uno de los problemas más desafiantes en visión por computadora. La mayoría de los rastreadores basados en Transformer suelen requerir una potencia computacional y de almacenamiento costosa, lo que hace que estos rastreadores robustos no puedan lograr un rendimiento en tiempo real satisfactorio en dispositivos con recursos limitados. En este trabajo, proponemos un rastreador ligero, AnteaTrack. Para localizar el objetivo de manera más precisa, este documento presenta un operador de filtrado máximo invariante a la escala. Utiliza un max-pooling local para filtrar la porción del objetivo sospechoso en ventanas deslizantes superpuestas para mejorar mientras suprime el fondo. Para obtener una caja delimitadora de objetivo más compacta, este documento presenta un módulo de aumento basado en Pixel-Shuffle para aumentar la expresión detallada de las características del objetivo. Además, AnteaTrack puede funcionar en tiempo real a 47 cuadros por segundo (FPS) en una CPU. Probamos AnteaTrack en cinco conjuntos de datos, y un gran número de experimentos mostraron que AnteaTrack proporciona la solución más eficiente en comparación con el mismo tipo de rastreadores en tiempo real de CPU.
Descripción
El seguimiento en tiempo real es uno de los problemas más desafiantes en visión por computadora. La mayoría de los rastreadores basados en Transformer suelen requerir una potencia computacional y de almacenamiento costosa, lo que hace que estos rastreadores robustos no puedan lograr un rendimiento en tiempo real satisfactorio en dispositivos con recursos limitados. En este trabajo, proponemos un rastreador ligero, AnteaTrack. Para localizar el objetivo de manera más precisa, este documento presenta un operador de filtrado máximo invariante a la escala. Utiliza un max-pooling local para filtrar la porción del objetivo sospechoso en ventanas deslizantes superpuestas para mejorar mientras suprime el fondo. Para obtener una caja delimitadora de objetivo más compacta, este documento presenta un módulo de aumento basado en Pixel-Shuffle para aumentar la expresión detallada de las características del objetivo. Además, AnteaTrack puede funcionar en tiempo real a 47 cuadros por segundo (FPS) en una CPU. Probamos AnteaTrack en cinco conjuntos de datos, y un gran número de experimentos mostraron que AnteaTrack proporciona la solución más eficiente en comparación con el mismo tipo de rastreadores en tiempo real de CPU.