Reconsiderando la agregación multi-branch para la segmentación semántica
Autores: Cai, Pengjie; Yang, Derong; Zou, Yonglin; Chen, Ruihan; Dai, Ming
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reconsiderando la agregación multi-branch para la segmentación semántica
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Agregación
Mapas de características
Agrupación piramidal espacial atrous
Mecanismo de atención
Parámetros adaptativos
Conjunto de datos de referencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
Para tareas de segmentación semántica, existen problemas al usar estructuras de múltiples ramas para enriquecer mapas de características y agregar diferentes ramas de mapas de características en una cierta profundidad de red, como la insuficiente riqueza de mapas de características y la agregación incompleta de mapas de características. Dado mapas de características de múltiples ramas y agregación de ramas, este estudio propone un método ligero, llamado agrupación piramidal atrous de múltiples ramas, al introducir un mecanismo de atención y CARAFE para enriquecer las características de los mapas de características, dar a los mapas de características parámetros adaptativos, ajustar periódicamente los parámetros adaptativos y agregar los mapas de características en ambas direcciones vertical y horizontal. Primero, se conserva la pirámide atrous y se utiliza el mecanismo de atención y CARAFE para manejar las características de agrupación y obtener 10 mapas de características diferentes. En segundo lugar, dando a cada mapa de características un parámetro adaptativo en cascada y ajustando periódicamente el parámetro adaptativo para promover o suprimir ciertos mapas de características evita que el modelo se mantenga en un mínimo local o punto de silla durante largos períodos debido a la incertidumbre aleatoria. Finalmente, los mapas de características se agregan verticalmente, se agregan horizontalmente y se ponderan para la suma. Este trabajo demuestra un rendimiento competitivo en el conjunto de datos de referencia, con una mejora del 1,88% en MPA, 0,66% en FWIoU y 1,29% en MIoU en comparación con la agrupación piramidal atrous espacial. Los conjuntos de datos de referencia incluyen PASCAL VOC 2012 y CIFAR-100.
Descripción
Para tareas de segmentación semántica, existen problemas al usar estructuras de múltiples ramas para enriquecer mapas de características y agregar diferentes ramas de mapas de características en una cierta profundidad de red, como la insuficiente riqueza de mapas de características y la agregación incompleta de mapas de características. Dado mapas de características de múltiples ramas y agregación de ramas, este estudio propone un método ligero, llamado agrupación piramidal atrous de múltiples ramas, al introducir un mecanismo de atención y CARAFE para enriquecer las características de los mapas de características, dar a los mapas de características parámetros adaptativos, ajustar periódicamente los parámetros adaptativos y agregar los mapas de características en ambas direcciones vertical y horizontal. Primero, se conserva la pirámide atrous y se utiliza el mecanismo de atención y CARAFE para manejar las características de agrupación y obtener 10 mapas de características diferentes. En segundo lugar, dando a cada mapa de características un parámetro adaptativo en cascada y ajustando periódicamente el parámetro adaptativo para promover o suprimir ciertos mapas de características evita que el modelo se mantenga en un mínimo local o punto de silla durante largos períodos debido a la incertidumbre aleatoria. Finalmente, los mapas de características se agregan verticalmente, se agregan horizontalmente y se ponderan para la suma. Este trabajo demuestra un rendimiento competitivo en el conjunto de datos de referencia, con una mejora del 1,88% en MPA, 0,66% en FWIoU y 1,29% en MIoU en comparación con la agrupación piramidal atrous espacial. Los conjuntos de datos de referencia incluyen PASCAL VOC 2012 y CIFAR-100.