logo móvil
Contáctanos

Un red híbrido ligero de supervisión débil para el conteo eficiente de multitudes

Autores: Chen, Yongqi; Zhao, Huailin; Gao, Ming; Deng, Mingfang

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Un red híbrido ligero de supervisión débil para el conteo eficiente de multitudes


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Redes de conteo de multitudes
Modelos ligeros
Bloque Swin-Transformer
Módulo de Agregación de Pirámide Pooling
Módulo de atención cruzada
Guía débilmente supervisada

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
Las redes de conteo de multitudes se han convertido en el método principal para implementar técnicas de conteo de multitudes en dispositivos con recursos limitados. Se ha logrado un progreso significativo en este campo, con muchos modelos livianos sobresalientes propuestos sucesivamente. Sin embargo, aún existen desafíos como la variación escasa, la extracción de características globales y los requisitos de anotación detallada de las cabezas en tareas relevantes, lo que hace necesario un mayor perfeccionamiento. En este artículo, proponemos una red de conteo de multitudes híbrida liviana débilmente supervisada que integra las capas iniciales de GhostNet como la columna vertebral para extraer eficientemente características locales y enriquecer características intermedias. La incorporación de un bloque Swin-Transformer modificado aborda la necesidad de información efectiva de contexto global. Un Módulo de Agregación de Pirámide Pooling maneja el problema inherente de variación de escala en tareas de conteo de multitudes de una manera más eficiente en términos de computación. Este módulo, junto con el módulo de atención cruzada, sirve como puentes para promover el flujo de información de características entre características locales e información de contexto global. Finalmente, se diseña un módulo de regresor simplificado para permitir que el modelo propuesto con orientación débilmente supervisada para el entrenamiento evite las anotaciones precisas a nivel de ubicación, señalando que la omisión de la generación de mapas de densidad hace que la red propuesta sea más liviana. Nuestros resultados en el conjunto de datos UCF-QNRF indican que nuestro modelo es un 8.73% y un 12.17% más preciso en las métricas de MAE y MSE, respectivamente, que el segundo mejor ARNet, en el que los parámetros disminuyen en un 4.52%. En el conjunto de datos ShanghaiTech A, MAE y MSE disminuyen un 1.5% y un 3.2%, respectivamente, en comparación con el segundo mejor PDDNet. Los resultados experimentales para la evaluación de precisión y velocidad de inferencia en algunos conjuntos de datos principales validan el principio de diseño efectivo de nuestro modelo.

Otros recursos que podrían interesarte

Temas Virtualpro