TensorTrack: Descomposición de Tensores para el Seguimiento de Objetos en Video

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

TensorTrack: Descomposición de Tensores para el Seguimiento de Objetos en Video

Autores: Gu, Yuntao; Zhao, Pengfei; Cheng, Lan; Guo, Yuanjun; Wang, Haikuan; Ding, Wenjun; Liu, Yu

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

TensorTrack: Descomposición de Tensores para el Seguimiento de Objetos en Video

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Seguimiento de objetos en video

Descomposición tensorial

Algoritmo de sustracción de fondo

Filtro de correlación de múltiples núcleos

Descomposición Tucker2

Solución de seguimiento en tiempo real

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones

El Seguimiento de Objetos en Video (VOT) es una tarea crítica en visión por computadora. Mientras que los rastreadores basados en Siamese y en Transformer son ampliamente utilizados en VOT, tienen dificultades para desempeñarse bien en la prueba OTB100 debido a la falta de conjuntos de entrenamiento dedicados. Este desafío destaca la dificultad de generalizar de manera efectiva a datos desconocidos. Para abordar este problema, este artículo propone un método innovador que utiliza la descomposición tensorial, un concepto poco explorado en la investigación de seguimiento de objetos. Al aplicar la descomposición tensorial de norma L1, las secuencias de video se representan como tensores de cuatro modos, y se introduce un algoritmo de sustracción de fondo en tiempo real, lo que permite modelar de manera efectiva la relación objetivo-fondo y adaptarse a cambios ambientales, lo que produce un seguimiento preciso y robusto. Además, el artículo integra un filtro de correlación multi-núcleo mejorado en un solo fotograma, localizando y siguiendo el objetivo al comparar la correlación entre la plantilla del objetivo y la imagen de entrada. Para mejorar aún más la precisión y la robustez de la localización, el artículo también incorpora la descomposición Tucker2 para integrar patrones de apariencia y movimiento, generando mapas de calor compuestos. El método se evalúa en el conjunto de datos de referencia OTB100, mostrando mejoras significativas tanto en rendimiento como en velocidad en comparación con métodos tradicionales. Los resultados experimentales demuestran que el método propuesto logra una mejora del 15.8% en el AUC y un aumento de diez veces en la velocidad en comparación con los métodos típicos basados en aprendizaje profundo, proporcionando una solución de seguimiento en tiempo real eficiente y precisa, especialmente en escenarios con características de objetivo-fondo similares, movimiento de alta velocidad y movimiento limitado del objetivo.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro