Msgsa: red de autoatención guiada multi-escala para el conteo de multitudes
Autores: Sun, Yange; Li, Meng; Guo, Huaping; Zhang, Li
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Msgsa: red de autoatención guiada multi-escala para el conteo de multitudes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales convolucionales
Conteo de multitudes
Mecanismos de autoatención
Información contextual a múltiples escalas
Módulo de Pirámide de Características
Fusión de Características Consciente de la Escala
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 53
Citaciones: Sin citaciones
El uso de redes neuronales convolucionales (CNN) para el conteo de multitudes ha avanzado significativamente en los últimos años; sin embargo, abordar de manera efectiva la variación de escala y los fondos complejos sigue siendo una tarea desafiante. Para hacer frente a estos desafíos, proponemos una nueva red de Autoatención Guiada Multi-Escala (MSGSA) que utiliza mecanismos de autoatención para capturar información contextual multi-escala para el conteo de multitudes. La red MSGSA consta de tres módulos clave: un Módulo de Pirámide de Características (FPM), un Módulo de Autoatención de Escala (SSAM) y una Fusión de Características Conscientes de Escala (SFA). Al integrar mecanismos de autoatención en múltiples escalas, nuestro método propuesto captura información contextual tanto global como local, lo que lleva a una mejora en la precisión del conteo de multitudes. Realizamos experimentos extensos en múltiples conjuntos de datos de referencia, y los resultados demuestran que nuestro método supera a la mayoría de los métodos existentes en cuanto a precisión de conteo y calidad del mapa de densidad generado. Nuestra red MSGSA propuesta proporciona una dirección prometedora para el conteo eficiente y preciso de multitudes en fondos complejos.
Descripción
El uso de redes neuronales convolucionales (CNN) para el conteo de multitudes ha avanzado significativamente en los últimos años; sin embargo, abordar de manera efectiva la variación de escala y los fondos complejos sigue siendo una tarea desafiante. Para hacer frente a estos desafíos, proponemos una nueva red de Autoatención Guiada Multi-Escala (MSGSA) que utiliza mecanismos de autoatención para capturar información contextual multi-escala para el conteo de multitudes. La red MSGSA consta de tres módulos clave: un Módulo de Pirámide de Características (FPM), un Módulo de Autoatención de Escala (SSAM) y una Fusión de Características Conscientes de Escala (SFA). Al integrar mecanismos de autoatención en múltiples escalas, nuestro método propuesto captura información contextual tanto global como local, lo que lleva a una mejora en la precisión del conteo de multitudes. Realizamos experimentos extensos en múltiples conjuntos de datos de referencia, y los resultados demuestran que nuestro método supera a la mayoría de los métodos existentes en cuanto a precisión de conteo y calidad del mapa de densidad generado. Nuestra red MSGSA propuesta proporciona una dirección prometedora para el conteo eficiente y preciso de multitudes en fondos complejos.