Aprendizaje profundo de afinidad de apariencia para seguimiento y reidentificación de múltiples objetos: una vista comparativa
Autores: Gómez-Silva, María J.; de la Escalera, Arturo; Armingol, José M.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Aprendizaje profundo de afinidad de apariencia para seguimiento y reidentificación de múltiples objetos: una vista comparativa
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Identidad
Vigilancia
Seguimiento
Reidentificación
Modelo neural
Función de pérdida
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Reconocer la identidad de un individuo en una secuencia de vigilancia es el núcleo de los algoritmos de Seguimiento de Múltiples Objetos (MOT) y Re-Identificación (Re-Id). Ambas tareas pueden abordarse midiendo la afinidad de apariencia entre las observaciones de las personas con un modelo neuronal profundo. Sin embargo, las diferencias en sus especificaciones y, consecuentemente, en las características y restricciones de los datos de entrenamiento disponibles para cada una de estas tareas, surgen de la necesidad de emplear enfoques de aprendizaje diferentes para lograr cada una de ellas. Este artículo ofrece una vista comparativa de la función de pérdida Double-Margin-Contrastive y Triplet, y analiza los beneficios y desventajas de aplicar cada una de ellas para aprender un modelo de Afinidad de Apariencia para Seguimiento y Re-Identificación. Se ha realizado un conjunto de experimentos, y sus resultados respaldan la hipótesis concluida a partir del estudio presentado: la función de pérdida Triplet es más efectiva que la función Contrastive cuando se aprende un modelo Re-Id, y, por el contrario, en el dominio MOT, la pérdida Contrastive puede discriminar mejor entre pares de imágenes que representan a la misma persona o no.
Descripción
Reconocer la identidad de un individuo en una secuencia de vigilancia es el núcleo de los algoritmos de Seguimiento de Múltiples Objetos (MOT) y Re-Identificación (Re-Id). Ambas tareas pueden abordarse midiendo la afinidad de apariencia entre las observaciones de las personas con un modelo neuronal profundo. Sin embargo, las diferencias en sus especificaciones y, consecuentemente, en las características y restricciones de los datos de entrenamiento disponibles para cada una de estas tareas, surgen de la necesidad de emplear enfoques de aprendizaje diferentes para lograr cada una de ellas. Este artículo ofrece una vista comparativa de la función de pérdida Double-Margin-Contrastive y Triplet, y analiza los beneficios y desventajas de aplicar cada una de ellas para aprender un modelo de Afinidad de Apariencia para Seguimiento y Re-Identificación. Se ha realizado un conjunto de experimentos, y sus resultados respaldan la hipótesis concluida a partir del estudio presentado: la función de pérdida Triplet es más efectiva que la función Contrastive cuando se aprende un modelo Re-Id, y, por el contrario, en el dominio MOT, la pérdida Contrastive puede discriminar mejor entre pares de imágenes que representan a la misma persona o no.