SiamMAN: Red Siamés Consciente de Múltiples Fases para el Seguimiento en Tiempo Real de Vehículos Aéreos No Tripulados
Autores: Liu, Faxue; Wang, Xuan; Chen, Qiqi; Liu, Jinghong; Liu, Chenglong
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
SiamMAN: Red Siamés Consciente de Múltiples Fases para el Seguimiento en Tiempo Real de Vehículos Aéreos No Tripulados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Tareas de seguimiento aéreo
Redes conscientes de múltiples fases
Dependencias a largo plazo
Fusión de características
Información contextual
Puntos de referencia de seguimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este artículo, abordamos tareas de seguimiento aéreo diseñando redes conscientes de múltiples fases para obtener ricas dependencias de largo alcance. Para las tareas de seguimiento aéreo, los métodos existentes son propensos a la deriva de seguimiento en escenarios con alta demanda de dependencias de características de largo alcance en múltiples capas, como el cambio de punto de vista causado por las características de la perspectiva de disparo del UAV, baja resolución, etc. En contraste con los trabajos anteriores que solo utilizaron fusión de características a múltiples escalas para obtener información contextual, diseñamos una nueva arquitectura para adaptar las características de diferentes niveles de características en escenarios desafiantes para integrar de manera adaptativa características regionales y la información de dependencias globales correspondientes. Específicamente, para el rastreador propuesto (SiamMAN), primero proponemos un cuello consciente de dos etapas (TAN), donde primero se utiliza un codificador de división en cascada (CSE) para obtener la relevancia de largo alcance distribuida entre las subramas mediante la división de canales de características, y luego se utiliza un decodificador contextual de múltiples niveles (MCD) para lograr una fusión adicional de dependencias globales. Finalmente, diseñamos el codificador de contexto del mapa de respuesta (RCE) utilizando información contextual de largo alcance en la retropropagación para lograr una actualización a nivel de píxel para las características más profundas y equilibrar mejor la información semántica y espacial. Varios experimentos en benchmarks de seguimiento bien conocidos ilustran que el método propuesto supera a los rastreadores SOTA, lo que resulta de la utilización efectiva de la red consciente de múltiples fases propuesta para diferentes niveles de características.
Descripción
En este artículo, abordamos tareas de seguimiento aéreo diseñando redes conscientes de múltiples fases para obtener ricas dependencias de largo alcance. Para las tareas de seguimiento aéreo, los métodos existentes son propensos a la deriva de seguimiento en escenarios con alta demanda de dependencias de características de largo alcance en múltiples capas, como el cambio de punto de vista causado por las características de la perspectiva de disparo del UAV, baja resolución, etc. En contraste con los trabajos anteriores que solo utilizaron fusión de características a múltiples escalas para obtener información contextual, diseñamos una nueva arquitectura para adaptar las características de diferentes niveles de características en escenarios desafiantes para integrar de manera adaptativa características regionales y la información de dependencias globales correspondientes. Específicamente, para el rastreador propuesto (SiamMAN), primero proponemos un cuello consciente de dos etapas (TAN), donde primero se utiliza un codificador de división en cascada (CSE) para obtener la relevancia de largo alcance distribuida entre las subramas mediante la división de canales de características, y luego se utiliza un decodificador contextual de múltiples niveles (MCD) para lograr una fusión adicional de dependencias globales. Finalmente, diseñamos el codificador de contexto del mapa de respuesta (RCE) utilizando información contextual de largo alcance en la retropropagación para lograr una actualización a nivel de píxel para las características más profundas y equilibrar mejor la información semántica y espacial. Varios experimentos en benchmarks de seguimiento bien conocidos ilustran que el método propuesto supera a los rastreadores SOTA, lo que resulta de la utilización efectiva de la red consciente de múltiples fases propuesta para diferentes niveles de características.