Red de Reidentificación Multiescala de Vista Cruzada desde la Perspectiva de un Vehículo Aéreo no Tripulado de Rotorcraft Terrestre
Autores: Yin, Wenji; Peng, Yueping; Hao, Hexiang; Han, Baixuan; Ye, Zecong; Liu, Wenchao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Red de Reidentificación Multiescala de Vista Cruzada desde la Perspectiva de un Vehículo Aéreo no Tripulado de Rotorcraft Terrestre
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tradicional
Reidentificación
Cámaras
Perspectivas
Características
Modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Los esquemas tradicionales de reidentificación (Re-ID) a menudo dependen de múltiples cámaras desde la misma perspectiva para buscar objetivos. Sin embargo, la colaboración entre cámaras fijas y vehículos aéreos no tripulados (UAVs) se está convirtiendo gradualmente en una nueva tendencia en el campo de la vigilancia. Enfrentando las significativas diferencias de perspectiva entre las cámaras fijas y las cámaras de UAV, la tarea de Re-ID se enfrenta a desafíos sin precedentes. En el entorno de una sola perspectiva, aunque se han logrado avances significativos en los modelos de Re-ID de personas, su rendimiento disminuye notablemente cuando se enfrentan a cambios drásticos de puntos de vista, como transiciones de perspectivas aéreas a nivel del suelo. Esta degradación en el rendimiento se atribuye principalmente a las marcadas variaciones entre puntos de vista y las diferencias significativas en la postura del sujeto y el fondo en diversas perspectivas. Los métodos existentes que se centran en el aprendizaje de características locales han demostrado ser subóptimos en tareas de Re-ID entre perspectivas. La razón radica en la distorsión de la perspectiva causada por el punto de vista superior de los drones, y en la información de textura más rica y detallada observada desde una perspectiva a nivel del suelo, lo que conduce a discrepancias notables en las características locales. Para abordar este problema, el presente estudio introduce un Modelo Multi-escala a Través de Vistas (MAVM) que extrae características en diversas escalas para generar una representación de características más rica y robusta. Además, incorporamos un Módulo de Alineación Cruzada de Vistas (AVAM) que ajusta finamente los pesos de atención, optimizando la respuesta del modelo a áreas críticas como la silueta, las texturas de la vestimenta y otras características clave. Esta mejora garantiza una alta precisión de reconocimiento incluso cuando los sujetos cambian de postura y condiciones de iluminación. Experimentos extensos realizados en el conjunto de datos público AG-ReID han demostrado la superioridad de nuestro método propuesto, que supera significativamente a las técnicas actuales más avanzadas.
Descripción
Los esquemas tradicionales de reidentificación (Re-ID) a menudo dependen de múltiples cámaras desde la misma perspectiva para buscar objetivos. Sin embargo, la colaboración entre cámaras fijas y vehículos aéreos no tripulados (UAVs) se está convirtiendo gradualmente en una nueva tendencia en el campo de la vigilancia. Enfrentando las significativas diferencias de perspectiva entre las cámaras fijas y las cámaras de UAV, la tarea de Re-ID se enfrenta a desafíos sin precedentes. En el entorno de una sola perspectiva, aunque se han logrado avances significativos en los modelos de Re-ID de personas, su rendimiento disminuye notablemente cuando se enfrentan a cambios drásticos de puntos de vista, como transiciones de perspectivas aéreas a nivel del suelo. Esta degradación en el rendimiento se atribuye principalmente a las marcadas variaciones entre puntos de vista y las diferencias significativas en la postura del sujeto y el fondo en diversas perspectivas. Los métodos existentes que se centran en el aprendizaje de características locales han demostrado ser subóptimos en tareas de Re-ID entre perspectivas. La razón radica en la distorsión de la perspectiva causada por el punto de vista superior de los drones, y en la información de textura más rica y detallada observada desde una perspectiva a nivel del suelo, lo que conduce a discrepancias notables en las características locales. Para abordar este problema, el presente estudio introduce un Modelo Multi-escala a Través de Vistas (MAVM) que extrae características en diversas escalas para generar una representación de características más rica y robusta. Además, incorporamos un Módulo de Alineación Cruzada de Vistas (AVAM) que ajusta finamente los pesos de atención, optimizando la respuesta del modelo a áreas críticas como la silueta, las texturas de la vestimenta y otras características clave. Esta mejora garantiza una alta precisión de reconocimiento incluso cuando los sujetos cambian de postura y condiciones de iluminación. Experimentos extensos realizados en el conjunto de datos público AG-ReID han demostrado la superioridad de nuestro método propuesto, que supera significativamente a las técnicas actuales más avanzadas.