Encuesta de reidentificación de personas de modalidad cruzada desde una perspectiva matemática
Autores: Liu, Minghui; Zhang, Yafei; Li, Huafeng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Encuesta de reidentificación de personas de modalidad cruzada desde una perspectiva matemática
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Reidentificación de personas
Sistema de vigilancia
Cruz-modal
Brecha modal
Modelos basados en aprendizaje profundo
Perspectiva matemática
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La reidentificación de personas (Re-ID) tiene como objetivo recuperar la identificación de un peatón en particular de un sistema de vigilancia que consiste en cámaras no superpuestas. En los últimos años, los investigadores han comenzado a centrarse en tareas de Re-ID de personas en un mundo abierto basadas en situaciones no ideales. Uno de los más representativos de estos es el Re-ID de personas multimodal, que tiene como objetivo emparejar datos de sonda con datos objetivo de diferentes modalidades. Según las modalidades de los datos de sonda y objetivo, dividimos el Re-ID de personas multimodal en visible-infrarrojo, visible-profundo, visible-boceto y visible-texto. En el Re-ID de personas multimodal, el problema más desafiante es la brecha modal. Según los diferentes métodos para reducir la brecha modal, clasificamos los trabajos existentes en métodos de conversión de estilo basados en imágenes, métodos de mapeo de incrustación invariante de la modalidad basados en características y métodos de extracción de información auxiliar no relacionada con la modalidad. Además, al generalizar los trabajos mencionados anteriormente, descubrimos que aunque los modelos basados en aprendizaje profundo funcionan bien, el proceso de aprendizaje tipo caja negra hace que estos modelos sean menos interpretables y generalizados. Por lo tanto, intentamos interpretar diferentes modelos de Re-ID de personas multimodales desde una perspectiva matemática. A través del trabajo anterior, intentamos compensar la falta de interpretación matemática de modelos en revisiones anteriores de Re-ID de personas y esperamos que nuestro trabajo traiga nueva inspiración a los investigadores.
Descripción
La reidentificación de personas (Re-ID) tiene como objetivo recuperar la identificación de un peatón en particular de un sistema de vigilancia que consiste en cámaras no superpuestas. En los últimos años, los investigadores han comenzado a centrarse en tareas de Re-ID de personas en un mundo abierto basadas en situaciones no ideales. Uno de los más representativos de estos es el Re-ID de personas multimodal, que tiene como objetivo emparejar datos de sonda con datos objetivo de diferentes modalidades. Según las modalidades de los datos de sonda y objetivo, dividimos el Re-ID de personas multimodal en visible-infrarrojo, visible-profundo, visible-boceto y visible-texto. En el Re-ID de personas multimodal, el problema más desafiante es la brecha modal. Según los diferentes métodos para reducir la brecha modal, clasificamos los trabajos existentes en métodos de conversión de estilo basados en imágenes, métodos de mapeo de incrustación invariante de la modalidad basados en características y métodos de extracción de información auxiliar no relacionada con la modalidad. Además, al generalizar los trabajos mencionados anteriormente, descubrimos que aunque los modelos basados en aprendizaje profundo funcionan bien, el proceso de aprendizaje tipo caja negra hace que estos modelos sean menos interpretables y generalizados. Por lo tanto, intentamos interpretar diferentes modelos de Re-ID de personas multimodales desde una perspectiva matemática. A través del trabajo anterior, intentamos compensar la falta de interpretación matemática de modelos en revisiones anteriores de Re-ID de personas y esperamos que nuestro trabajo traiga nueva inspiración a los investigadores.