Psf-c-net: un modelo de aprendizaje profundo contrafactual para la reidentificación de personas basado en parches de recorte aleatorio y relleno de mezcla
Autores: Sun, Ruiwang; Chen, Qing; Dong, Heng; Zhang, Haifeng; Wang, Meng
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Psf-c-net: un modelo de aprendizaje profundo contrafactual para la reidentificación de personas basado en parches de recorte aleatorio y relleno de mezcla
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tarea
Reidentificación de personas
Dependencia a larga distancia
Información global
Marco de aprendizaje contrafactual
PSF-C-Net
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
En la tarea de reidentificación de personas (re-ID), capturar la dependencia a largo plazo de las instancias es crucial para una identificación precisa. Los métodos existentes sobresalen en la extracción de características locales pero a menudo pasan por alto la información global de las imágenes de las instancias. Para abordar esta limitación, proponemos un marco de aprendizaje contrafactual basado en convoluciones, llamado PSF-C-Net, para centrarse en la información global en lugar de en características locales detalladas. PSF-C-Net adopta una estructura de doble vía con uso compartido de parámetros para realizar operaciones contrafactuales en el espacio de predicción. Toma tanto la imagen de la instancia real como una imagen de instancia contrafactual que interrumpe la relación contextual como entrada. El marco contrafactual permite la modelización interpretable de características globales sin introducir parámetros adicionales. Además, proponemos un método novedoso para generar imágenes de instancia contrafactual, que construye de manera efectiva un espacio contrafactual explícito, para implementar estrategias contrafactuales de manera confiable. Hemos realizado experimentos extensos para evaluar el rendimiento de PSF-C-Net en los conjuntos de datos Market-1501 y Duke-MTMC-reID. Los resultados demuestran que PSF-C-Net logra un rendimiento de vanguardia.
Descripción
En la tarea de reidentificación de personas (re-ID), capturar la dependencia a largo plazo de las instancias es crucial para una identificación precisa. Los métodos existentes sobresalen en la extracción de características locales pero a menudo pasan por alto la información global de las imágenes de las instancias. Para abordar esta limitación, proponemos un marco de aprendizaje contrafactual basado en convoluciones, llamado PSF-C-Net, para centrarse en la información global en lugar de en características locales detalladas. PSF-C-Net adopta una estructura de doble vía con uso compartido de parámetros para realizar operaciones contrafactuales en el espacio de predicción. Toma tanto la imagen de la instancia real como una imagen de instancia contrafactual que interrumpe la relación contextual como entrada. El marco contrafactual permite la modelización interpretable de características globales sin introducir parámetros adicionales. Además, proponemos un método novedoso para generar imágenes de instancia contrafactual, que construye de manera efectiva un espacio contrafactual explícito, para implementar estrategias contrafactuales de manera confiable. Hemos realizado experimentos extensos para evaluar el rendimiento de PSF-C-Net en los conjuntos de datos Market-1501 y Duke-MTMC-reID. Los resultados demuestran que PSF-C-Net logra un rendimiento de vanguardia.