Red de Bilateral Asimétrica Consciente de Escala y Fondo para el Conteo de Multitudes en Imágenes No Restringidas
Autores: Lv, Gang; Xu, Yushan; Ma, Zuchang; Sun, Yining; Nian, Fudong
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Red de Bilateral Asimétrica Consciente de Escala y Fondo para el Conteo de Multitudes en Imágenes No Restringidas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Conteo de multitudes basado en imágenes
Variación de escala
Fondo complejo
SBAB-Net
Red neuronal convolucional
Mapa de densidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Este documento aborda los dos desafíos difíciles del conteo de multitudes basado en imágenes, es decir, la variación de escala y el fondo complejo. Para ello, presentamos un nuevo método de conteo de multitudes, llamado Red Bilateral Asimétrica Consciente de la Escala y el Fondo (SBAB-Net), que es capaz de manejar la variación de escala y el ruido de fondo en un marco unificado. Específicamente, el SBAB-Net propuesto contiene tres componentes principales, una red neuronal convolucional (CNN) de espalda pre-entrenada como extractor de características y dos ramas asimétricas para generar un mapa de densidad. Estas dos ramas asimétricas tienen estructuras diferentes y utilizan características de diferentes capas semánticas. Una rama es una subred de convolución dilatada apilada densamente conectada (DCSDC) con diferentes tasas de dilatación, que se basa en una capa de características profundas y puede manejar la variación de escala. La otra rama es una subred de agrupamiento apilado densamente conectada sin parámetros (DCSP) con varios núcleos y pasos de agrupamiento, que se basa en características superficiales y puede fusionar características con varios campos receptivos para reducir el impacto del ruido de fondo. Las dos subredes se fusionan mediante el mecanismo de atención para generar el mapa de densidad final. Los extensos resultados experimentales en tres conjuntos de datos de referencia ampliamente utilizados han demostrado la efectividad y superioridad de nuestro método propuesto: (1) Logramos un rendimiento competitivo en el conteo en comparación con los métodos de última generación; (2) En comparación con la línea base, el MAE y el MSE se reducen al menos en , respectivamente.
Descripción
Este documento aborda los dos desafíos difíciles del conteo de multitudes basado en imágenes, es decir, la variación de escala y el fondo complejo. Para ello, presentamos un nuevo método de conteo de multitudes, llamado Red Bilateral Asimétrica Consciente de la Escala y el Fondo (SBAB-Net), que es capaz de manejar la variación de escala y el ruido de fondo en un marco unificado. Específicamente, el SBAB-Net propuesto contiene tres componentes principales, una red neuronal convolucional (CNN) de espalda pre-entrenada como extractor de características y dos ramas asimétricas para generar un mapa de densidad. Estas dos ramas asimétricas tienen estructuras diferentes y utilizan características de diferentes capas semánticas. Una rama es una subred de convolución dilatada apilada densamente conectada (DCSDC) con diferentes tasas de dilatación, que se basa en una capa de características profundas y puede manejar la variación de escala. La otra rama es una subred de agrupamiento apilado densamente conectada sin parámetros (DCSP) con varios núcleos y pasos de agrupamiento, que se basa en características superficiales y puede fusionar características con varios campos receptivos para reducir el impacto del ruido de fondo. Las dos subredes se fusionan mediante el mecanismo de atención para generar el mapa de densidad final. Los extensos resultados experimentales en tres conjuntos de datos de referencia ampliamente utilizados han demostrado la efectividad y superioridad de nuestro método propuesto: (1) Logramos un rendimiento competitivo en el conteo en comparación con los métodos de última generación; (2) En comparación con la línea base, el MAE y el MSE se reducen al menos en , respectivamente.