Fcl: algoritmo de reidentificación de peatones basado en aprendizaje contrastivo de fusión de características
Autores: Li, Yuangang; Zhang, Yuhan; Gao, Yunlong; Xu, Bo; Liu, Xinyue
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Fcl: algoritmo de reidentificación de peatones basado en aprendizaje contrastivo de fusión de características
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Reidentificación de peatones
Tecnología de visión por computadora
Aprendizaje contrastivo de fusión de características
Agrupación circular
Método de agrupación de fusión de características
FocalLoss
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
La reidentificación de peatones aprovecha la tecnología de visión por ordenador para lograr la coincidencia entre cámaras de peatones; recientemente ha llevado a avances significativos y presenta numerosas aplicaciones prácticas. Sin embargo, los algoritmos actuales enfrentan los siguientes desafíos: (1) la mayoría de los métodos son supervisados, dependen en gran medida de conjuntos de datos específicos y carecen de capacidades de generalización robustas; (2) es difícil extraer características debido a la forma alargada y estrecha de las imágenes de peatones que introduce distribuciones de características desiguales; (3) el desequilibrio sustancial entre muestras positivas y negativas. Para abordar estos desafíos, presentamos un algoritmo no supervisado de reidentificación de peatones llamado Aprendizaje Contrastivo de Fusión de Características (FCL) para extraer características más efectivas. Específicamente, empleamos agrupación circular para fusionar características de red en diferentes niveles para la reidentificación de peatones y mejorar la capacidad de generalización robusta. Además, proponemos un método de agrupación de fusión de características que facilita una distribución más eficiente de representaciones de características en imágenes de peatones. Finalmente, introducimos FocalLoss para calcular la pérdida a nivel de agrupación, mitigando el desequilibrio entre muestras positivas y negativas. A través de experimentos extensos realizados en tres conjuntos de datos prominentes, nuestro método propuesto demuestra un rendimiento prometedor, con una mejora promedio del 3.8% en los indicadores de mAP de FCL en comparación con los resultados base.
Descripción
La reidentificación de peatones aprovecha la tecnología de visión por ordenador para lograr la coincidencia entre cámaras de peatones; recientemente ha llevado a avances significativos y presenta numerosas aplicaciones prácticas. Sin embargo, los algoritmos actuales enfrentan los siguientes desafíos: (1) la mayoría de los métodos son supervisados, dependen en gran medida de conjuntos de datos específicos y carecen de capacidades de generalización robustas; (2) es difícil extraer características debido a la forma alargada y estrecha de las imágenes de peatones que introduce distribuciones de características desiguales; (3) el desequilibrio sustancial entre muestras positivas y negativas. Para abordar estos desafíos, presentamos un algoritmo no supervisado de reidentificación de peatones llamado Aprendizaje Contrastivo de Fusión de Características (FCL) para extraer características más efectivas. Específicamente, empleamos agrupación circular para fusionar características de red en diferentes niveles para la reidentificación de peatones y mejorar la capacidad de generalización robusta. Además, proponemos un método de agrupación de fusión de características que facilita una distribución más eficiente de representaciones de características en imágenes de peatones. Finalmente, introducimos FocalLoss para calcular la pérdida a nivel de agrupación, mitigando el desequilibrio entre muestras positivas y negativas. A través de experimentos extensos realizados en tres conjuntos de datos prominentes, nuestro método propuesto demuestra un rendimiento prometedor, con una mejora promedio del 3.8% en los indicadores de mAP de FCL en comparación con los resultados base.