logo móvil
Contáctanos

TensorTrack: Descomposición de Tensores para el Seguimiento de Objetos en Video

Autores: Gu, Yuntao; Zhao, Pengfei; Cheng, Lan; Guo, Yuanjun; Wang, Haikuan; Ding, Wenjun; Liu, Yu

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

TensorTrack: Descomposición de Tensores para el Seguimiento de Objetos en Video


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Seguimiento de objetos en video
Descomposición tensorial
Algoritmo de sustracción de fondo
Filtro de correlación de múltiples núcleos
Descomposición Tucker2
Solución de seguimiento en tiempo real

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
El Seguimiento de Objetos en Video (VOT) es una tarea crítica en visión por computadora. Mientras que los rastreadores basados en Siamese y en Transformer son ampliamente utilizados en VOT, tienen dificultades para desempeñarse bien en la prueba OTB100 debido a la falta de conjuntos de entrenamiento dedicados. Este desafío destaca la dificultad de generalizar de manera efectiva a datos desconocidos. Para abordar este problema, este artículo propone un método innovador que utiliza la descomposición tensorial, un concepto poco explorado en la investigación de seguimiento de objetos. Al aplicar la descomposición tensorial de norma L1, las secuencias de video se representan como tensores de cuatro modos, y se introduce un algoritmo de sustracción de fondo en tiempo real, lo que permite modelar de manera efectiva la relación objetivo-fondo y adaptarse a cambios ambientales, lo que produce un seguimiento preciso y robusto. Además, el artículo integra un filtro de correlación multi-núcleo mejorado en un solo fotograma, localizando y siguiendo el objetivo al comparar la correlación entre la plantilla del objetivo y la imagen de entrada. Para mejorar aún más la precisión y la robustez de la localización, el artículo también incorpora la descomposición Tucker2 para integrar patrones de apariencia y movimiento, generando mapas de calor compuestos. El método se evalúa en el conjunto de datos de referencia OTB100, mostrando mejoras significativas tanto en rendimiento como en velocidad en comparación con métodos tradicionales. Los resultados experimentales demuestran que el método propuesto logra una mejora del 15.8% en el AUC y un aumento de diez veces en la velocidad en comparación con los métodos típicos basados en aprendizaje profundo, proporcionando una solución de seguimiento en tiempo real eficiente y precisa, especialmente en escenarios con características de objetivo-fondo similares, movimiento de alta velocidad y movimiento limitado del objetivo.

Otros recursos que podrían interesarte

Temas Virtualpro