Una red siamesa sin anclaje basada en ConvNext y mejora de características para el seguimiento visual
Autores: Xu, Qiguo; Deng, Honggui; Zhang, Zeyu; Liu, Yang; Ruan, Xusheng; Liu, Gang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Una red siamesa sin anclaje basada en ConvNext y mejora de características para el seguimiento visual
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Basado en anclas
Rastreadores siameses
Diseño sin anclas
Red ConvNext
Seguimiento visual
Red de fusión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Los rastreadores siameses basados en anclas existentes dependen del diseño del ancla para predecir la escala y la relación de aspecto del objetivo. Sin embargo, estos métodos introducen muchos hiperparámetros, lo que conduce a redundancia computacional. En este documento, para lograr una eficiencia de red sobresaliente, proponemos una red de seguimiento siamés sin anclas basada en ConvNext (CAFSN), que emplea un diseño sin anclas para aumentar la flexibilidad y versatilidad de la red. En CAFSN, para obtener una red de base adecuada, la red ConvNext de última generación se aplica al campo del seguimiento visual por primera vez mediante la mejora de la zancada de la red y el campo receptivo. Además, se ofrece una rama de confianza central basada en la distancia euclidiana para suprimir cuadros de predicción de baja calidad en la red de predicción de clasificación de CAFSN para un seguimiento visual robusto. En particular, discutimos que la red siamesa no puede establecer un modelo de identificación completo para el objetivo de seguimiento y objetos similares, lo que afecta negativamente el rendimiento de la red. Construimos una red de Fusión que consiste en recorte y 3Dmaxpooling para distinguir mejor las capacidades de los objetivos y objetos similares. Este módulo utiliza 3DMaxpooling para seleccionar el valor de activación más alto y mejorar la diferencia entre él y otros objetos similares. El recorte unifica las dimensiones de diferentes características y reduce la cantidad de cálculos. Los experimentos de ablación demuestran que este módulo aumentó las tasas de éxito en un 1.7% y la precisión en un 0.5%. Evaluamos CAFSN en desafiantes benchmarks como OTB100, UAV123 y GOT-10K, validando un rendimiento avanzado en inmunidad al ruido e identificación de objetivos similares con 58.44 FPS en tiempo real.
Descripción
Los rastreadores siameses basados en anclas existentes dependen del diseño del ancla para predecir la escala y la relación de aspecto del objetivo. Sin embargo, estos métodos introducen muchos hiperparámetros, lo que conduce a redundancia computacional. En este documento, para lograr una eficiencia de red sobresaliente, proponemos una red de seguimiento siamés sin anclas basada en ConvNext (CAFSN), que emplea un diseño sin anclas para aumentar la flexibilidad y versatilidad de la red. En CAFSN, para obtener una red de base adecuada, la red ConvNext de última generación se aplica al campo del seguimiento visual por primera vez mediante la mejora de la zancada de la red y el campo receptivo. Además, se ofrece una rama de confianza central basada en la distancia euclidiana para suprimir cuadros de predicción de baja calidad en la red de predicción de clasificación de CAFSN para un seguimiento visual robusto. En particular, discutimos que la red siamesa no puede establecer un modelo de identificación completo para el objetivo de seguimiento y objetos similares, lo que afecta negativamente el rendimiento de la red. Construimos una red de Fusión que consiste en recorte y 3Dmaxpooling para distinguir mejor las capacidades de los objetivos y objetos similares. Este módulo utiliza 3DMaxpooling para seleccionar el valor de activación más alto y mejorar la diferencia entre él y otros objetos similares. El recorte unifica las dimensiones de diferentes características y reduce la cantidad de cálculos. Los experimentos de ablación demuestran que este módulo aumentó las tasas de éxito en un 1.7% y la precisión en un 0.5%. Evaluamos CAFSN en desafiantes benchmarks como OTB100, UAV123 y GOT-10K, validando un rendimiento avanzado en inmunidad al ruido e identificación de objetivos similares con 58.44 FPS en tiempo real.