logo móvil
Contáctanos

Red de Reidentificación Multiescala de Vista Cruzada desde la Perspectiva de un Vehículo Aéreo no Tripulado de Rotorcraft Terrestre

Autores: Yin, Wenji; Peng, Yueping; Hao, Hexiang; Han, Baixuan; Ye, Zecong; Liu, Wenchao

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Red de Reidentificación Multiescala de Vista Cruzada desde la Perspectiva de un Vehículo Aéreo no Tripulado de Rotorcraft Terrestre


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Tradicional
Reidentificación
Cámaras
Perspectivas
Características
Modelo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
Los esquemas tradicionales de reidentificación (Re-ID) a menudo dependen de múltiples cámaras desde la misma perspectiva para buscar objetivos. Sin embargo, la colaboración entre cámaras fijas y vehículos aéreos no tripulados (UAVs) se está convirtiendo gradualmente en una nueva tendencia en el campo de la vigilancia. Enfrentando las significativas diferencias de perspectiva entre las cámaras fijas y las cámaras de UAV, la tarea de Re-ID se enfrenta a desafíos sin precedentes. En el entorno de una sola perspectiva, aunque se han logrado avances significativos en los modelos de Re-ID de personas, su rendimiento disminuye notablemente cuando se enfrentan a cambios drásticos de puntos de vista, como transiciones de perspectivas aéreas a nivel del suelo. Esta degradación en el rendimiento se atribuye principalmente a las marcadas variaciones entre puntos de vista y las diferencias significativas en la postura del sujeto y el fondo en diversas perspectivas. Los métodos existentes que se centran en el aprendizaje de características locales han demostrado ser subóptimos en tareas de Re-ID entre perspectivas. La razón radica en la distorsión de la perspectiva causada por el punto de vista superior de los drones, y en la información de textura más rica y detallada observada desde una perspectiva a nivel del suelo, lo que conduce a discrepancias notables en las características locales. Para abordar este problema, el presente estudio introduce un Modelo Multi-escala a Través de Vistas (MAVM) que extrae características en diversas escalas para generar una representación de características más rica y robusta. Además, incorporamos un Módulo de Alineación Cruzada de Vistas (AVAM) que ajusta finamente los pesos de atención, optimizando la respuesta del modelo a áreas críticas como la silueta, las texturas de la vestimenta y otras características clave. Esta mejora garantiza una alta precisión de reconocimiento incluso cuando los sujetos cambian de postura y condiciones de iluminación. Experimentos extensos realizados en el conjunto de datos público AG-ReID han demostrado la superioridad de nuestro método propuesto, que supera significativamente a las técnicas actuales más avanzadas.

Otros recursos que podrían interesarte

Temas Virtualpro