Una Red de Fusión y Mejora de Características Multi-escala en Serie para la Re-identificación del Tigre de Amur
Autores: Xu, Nuo; Ma, Zhibin; Xia, Yi; Dong, Yanqi; Zi, Jiali; Xu, Delong; Xu, Fu; Su, Xiaohui; Zhang, Haiyan; Chen, Feixiang
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Una Red de Fusión y Mejora de Características Multi-escala en Serie para la Re-identificación del Tigre de Amur
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Tigre de Amur
Reidentificación
Evaluación de biodiversidad
Estadísticas de recursos de vida silvestre
Fusión de características a múltiples escalas
Videos de vigilancia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 7
Citaciones: Sin citaciones
El tigre de Amur es una especie en peligro de extinción importante en el mundo, y su re-identificación (re-ID) juega un papel crucial en la evaluación de la biodiversidad regional y las estadísticas de recursos de vida silvestre. Este documento se centra en la tarea de re-ID del tigre de Amur basada en imágenes de luz visible de capturas de pantalla de videos de vigilancia o trampas de cámara, con el objetivo de resolver el problema de baja precisión causado por la perspectiva de la cámara, el ruido de fondo, los cambios en la postura de movimiento y la deformación de los patrones corporales del tigre de Amur durante el proceso de re-ID. Para superar este desafío, proponemos una red de re-ID de tigre de Amur de fusión y mejora de características multiescala en serie para esta tarea, en la que se construyen ramas globales y locales. Específicamente, diseñamos un método de fusión de características multiescala en pirámide invertida global en la rama global para fusionar de manera efectiva características globales multiescala y lograr una preservación de características semánticas de alto nivel, finas y profundas. También diseñamos un método de mejora de características de atención de doble dominio local en la rama local, mejorando aún más la extracción y fusión de características locales al dividir bloques de características locales. Basado en la estructura del modelo anterior, evaluamos la efectividad y viabilidad del modelo en el conjunto de datos público de Re-identificación del Tigre de Amur en la Naturaleza (ATRW), y logramos buenos resultados en mAP, Rank-1 y Rank-5, demostrando una cierta competitividad. Además, dado que nuestro modelo propuesto no requiere la introducción de información de anotación adicional costosa y no incorpora otros módulos de preentrenamiento, tiene importantes ventajas como una fuerte transferibilidad y un entrenamiento simple.
Descripción
El tigre de Amur es una especie en peligro de extinción importante en el mundo, y su re-identificación (re-ID) juega un papel crucial en la evaluación de la biodiversidad regional y las estadísticas de recursos de vida silvestre. Este documento se centra en la tarea de re-ID del tigre de Amur basada en imágenes de luz visible de capturas de pantalla de videos de vigilancia o trampas de cámara, con el objetivo de resolver el problema de baja precisión causado por la perspectiva de la cámara, el ruido de fondo, los cambios en la postura de movimiento y la deformación de los patrones corporales del tigre de Amur durante el proceso de re-ID. Para superar este desafío, proponemos una red de re-ID de tigre de Amur de fusión y mejora de características multiescala en serie para esta tarea, en la que se construyen ramas globales y locales. Específicamente, diseñamos un método de fusión de características multiescala en pirámide invertida global en la rama global para fusionar de manera efectiva características globales multiescala y lograr una preservación de características semánticas de alto nivel, finas y profundas. También diseñamos un método de mejora de características de atención de doble dominio local en la rama local, mejorando aún más la extracción y fusión de características locales al dividir bloques de características locales. Basado en la estructura del modelo anterior, evaluamos la efectividad y viabilidad del modelo en el conjunto de datos público de Re-identificación del Tigre de Amur en la Naturaleza (ATRW), y logramos buenos resultados en mAP, Rank-1 y Rank-5, demostrando una cierta competitividad. Además, dado que nuestro modelo propuesto no requiere la introducción de información de anotación adicional costosa y no incorpora otros módulos de preentrenamiento, tiene importantes ventajas como una fuerte transferibilidad y un entrenamiento simple.