Análisis en profundidad de GAF-Net: enfoques de fusión comparativos en la reidentificación de personas basada en video
Autores: Boujou, Moncef; Iguernaissi, Rabah; Nicod, Lionel; Merad, Djamal; Dubuisson, Séverine
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Análisis en profundidad de GAF-Net: enfoques de fusión comparativos en la reidentificación de personas basada en video
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Modelo
Reidentificación de personas basada en video
GAF-Net
Características basadas en apariencia
Características basadas en marcha
Datos esqueléticos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Este estudio proporciona un análisis profundo de GAF-Net, un modelo novedoso para la reidentificación de personas basada en video que empareja individuos a través de diferentes secuencias de video. GAF-Net combina características basadas en apariencia con características basadas en la marcha derivadas de datos esqueléticos, ofreciendo un nuevo enfoque que difiere de los métodos tradicionales basados en siluetas. Examinamos a fondo cada módulo de GAF-Net y exploramos varios métodos de fusión tanto a nivel de puntuación como de características, yendo más allá de la simple concatenación inicial. Las evaluaciones exhaustivas en los conjuntos de datos iLIDS-VID y MARS demuestran la efectividad de GAF-Net en diferentes escenarios. GAF-Net logra una precisión de rango 1 de última generación en las largas secuencias de iLIDS-VID, mientras que los resultados de MARS (mAP, rango 1) revelan desafíos con secuencias más cortas y variables en entornos complejos del mundo real. Demostramos que la integración consistente de características de marcha basadas en esqueleto mejora el rendimiento de la reidentificación, especialmente con secuencias largas y más informativas. Esta investigación proporciona ideas cruciales sobre la integración de características multimodales en tareas de reidentificación, sentando las bases para el avance de sistemas biométricos multimodales para diversas aplicaciones de visión por computadora.
Descripción
Este estudio proporciona un análisis profundo de GAF-Net, un modelo novedoso para la reidentificación de personas basada en video que empareja individuos a través de diferentes secuencias de video. GAF-Net combina características basadas en apariencia con características basadas en la marcha derivadas de datos esqueléticos, ofreciendo un nuevo enfoque que difiere de los métodos tradicionales basados en siluetas. Examinamos a fondo cada módulo de GAF-Net y exploramos varios métodos de fusión tanto a nivel de puntuación como de características, yendo más allá de la simple concatenación inicial. Las evaluaciones exhaustivas en los conjuntos de datos iLIDS-VID y MARS demuestran la efectividad de GAF-Net en diferentes escenarios. GAF-Net logra una precisión de rango 1 de última generación en las largas secuencias de iLIDS-VID, mientras que los resultados de MARS (mAP, rango 1) revelan desafíos con secuencias más cortas y variables en entornos complejos del mundo real. Demostramos que la integración consistente de características de marcha basadas en esqueleto mejora el rendimiento de la reidentificación, especialmente con secuencias largas y más informativas. Esta investigación proporciona ideas cruciales sobre la integración de características multimodales en tareas de reidentificación, sentando las bases para el avance de sistemas biométricos multimodales para diversas aplicaciones de visión por computadora.