Una red siamesa sin anclaje basada en ConvNext y mejora de características para el seguimiento visual

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Una red siamesa sin anclaje basada en ConvNext y mejora de características para el seguimiento visual

Autores: Xu, Qiguo; Deng, Honggui; Zhang, Zeyu; Liu, Yang; Ruan, Xusheng; Liu, Gang

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Una red siamesa sin anclaje basada en ConvNext y mejora de características para el seguimiento visual

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Basado en anclas

Rastreadores siameses

Diseño sin anclas

Red ConvNext

Seguimiento visual

Red de fusión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 28

Citaciones: Sin citaciones

Los rastreadores siameses basados en anclas existentes dependen del diseño del ancla para predecir la escala y la relación de aspecto del objetivo. Sin embargo, estos métodos introducen muchos hiperparámetros, lo que conduce a redundancia computacional. En este documento, para lograr una eficiencia de red sobresaliente, proponemos una red de seguimiento siamés sin anclas basada en ConvNext (CAFSN), que emplea un diseño sin anclas para aumentar la flexibilidad y versatilidad de la red. En CAFSN, para obtener una red de base adecuada, la red ConvNext de última generación se aplica al campo del seguimiento visual por primera vez mediante la mejora de la zancada de la red y el campo receptivo. Además, se ofrece una rama de confianza central basada en la distancia euclidiana para suprimir cuadros de predicción de baja calidad en la red de predicción de clasificación de CAFSN para un seguimiento visual robusto. En particular, discutimos que la red siamesa no puede establecer un modelo de identificación completo para el objetivo de seguimiento y objetos similares, lo que afecta negativamente el rendimiento de la red. Construimos una red de Fusión que consiste en recorte y 3Dmaxpooling para distinguir mejor las capacidades de los objetivos y objetos similares. Este módulo utiliza 3DMaxpooling para seleccionar el valor de activación más alto y mejorar la diferencia entre él y otros objetos similares. El recorte unifica las dimensiones de diferentes características y reduce la cantidad de cálculos. Los experimentos de ablación demuestran que este módulo aumentó las tasas de éxito en un 1.7% y la precisión en un 0.5%. Evaluamos CAFSN en desafiantes benchmarks como OTB100, UAV123 y GOT-10K, validando un rendimiento avanzado en inmunidad al ruido e identificación de objetivos similares con 58.44 FPS en tiempo real.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro