logo móvil
Contáctanos

Red Siamés de Agregación Contextual Espacial-Temporal Ligera para el Seguimiento de Vehículos Aéreos No Tripulados

Autores: Chen, Qiqi; Liu, Jinghong; Liu, Faxue; Xu, Fang; Liu, Chenglong

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Red Siamés de Agregación Contextual Espacial-Temporal Ligera para el Seguimiento de Vehículos Aéreos No Tripulados


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Capacidad poderosa de extracción de características
Aprendizaje profundo
Rastreador siamés
Rendimiento avanzado de seguimiento
Agregación contextual temporal adaptativa
Seguimiento aéreo eficiente
Rendimiento de seguimiento aéreo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Beneficiándose de la poderosa capacidad de extracción de características del aprendizaje profundo, el rastreador siamés se destaca por su avanzado rendimiento de seguimiento. Sin embargo, limitado por los complejos fondos del seguimiento aéreo, como la baja resolución, la oclusión, objetos similares, objetos pequeños, variación de escala, cambio de relación de aspecto, deformación y recursos computacionales limitados, el seguimiento aéreo eficiente y preciso sigue siendo difícil de realizar. En este trabajo, diseñamos una red siamés adaptativa de agregación contextual temporal ligera y eficiente para el seguimiento aéreo, que está diseñada con un módulo atrous paralelo (PAM) y un modelo de agregación de contexto temporal adaptativo (ATCAM) para mitigar los problemas mencionados. En primer lugar, al utilizar una serie de convoluciones atrous con diferentes tasas de dilatación en paralelo, el PAM puede extraer y agregar simultáneamente características multiescala con información contextual espacial en el mismo mapa de características, lo que mejora efectivamente la capacidad de hacer frente a los cambios en la apariencia del objetivo causados por desafíos como el cambio de relación de aspecto, la oclusión, la variación de escala, etc. En segundo lugar, el ATCAM introduce de manera adaptativa información contextual temporal al marco objetivo a través de la estructura de codificador-decodificador, lo que ayuda al rastreador a resistir interferencias y reconocer el objetivo cuando es difícil extraer características de alta resolución, como objetos de baja resolución y similares. Finalmente, los experimentos en los benchmarks UAV20L, UAV123@10fps y DTB70 demuestran el impresionante rendimiento de la red propuesta funcionando a una alta velocidad de más de 75.5 fps en la NVIDIA 3060Ti.

Otros recursos que podrían interesarte

Temas Virtualpro