Mfdanet: red de agregación de flujo dual de características a varias escalas para la detección de objetos destacados
Autores: Ge, Bin; Pei, Jiajia; Xia, Chenxing; Wu, Taolin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mfdanet: red de agregación de flujo dual de características a varias escalas para la detección de objetos destacados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Desarrollo
Aprendizaje profundo
Detección de objetos destacados
Extracción de información de contexto
Red de agregación de doble flujo
Características a múltiples escalas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
Con el desarrollo del aprendizaje profundo, se han realizado mejoras significativas y optimizaciones en la detección de objetos salientes. Sin embargo, muchos métodos de detección de objetos salientes tienen limitaciones, como la extracción insuficiente de información de contexto, modos de interacción limitados para diferentes características de nivel y pérdida potencial de información debido a un solo modo de interacción. Para resolver los problemas mencionados anteriormente, propusimos una red de agregación de doble flujo basada en características multinivel, que consta de dos módulos principales, a saber, un módulo de extracción de información de contexto residual (RCIE) y un módulo de agregación de doble flujo denso (DDA). En primer lugar, el módulo RCIE fue diseñado para extraer completamente la información de contexto conectando características de diferentes campos receptivos a través de conexiones residuales, donde grupos convolucionales compuestos por convolución asimétrica y convolución dilatada se utilizan para extraer características de diferentes campos receptivos. En segundo lugar, el módulo DDA tuvo como objetivo mejorar las relaciones entre características de diferentes niveles aprovechando conexiones densas para obtener información de características de alta calidad. Finalmente, se utilizaron dos modos de interacción para la agregación de doble flujo para generar mapas de saliencia. Experimentos extensos en 5 conjuntos de datos de referencia muestran que el modelo propuesto se desempeña favorablemente frente a 15 métodos de vanguardia.
Descripción
Con el desarrollo del aprendizaje profundo, se han realizado mejoras significativas y optimizaciones en la detección de objetos salientes. Sin embargo, muchos métodos de detección de objetos salientes tienen limitaciones, como la extracción insuficiente de información de contexto, modos de interacción limitados para diferentes características de nivel y pérdida potencial de información debido a un solo modo de interacción. Para resolver los problemas mencionados anteriormente, propusimos una red de agregación de doble flujo basada en características multinivel, que consta de dos módulos principales, a saber, un módulo de extracción de información de contexto residual (RCIE) y un módulo de agregación de doble flujo denso (DDA). En primer lugar, el módulo RCIE fue diseñado para extraer completamente la información de contexto conectando características de diferentes campos receptivos a través de conexiones residuales, donde grupos convolucionales compuestos por convolución asimétrica y convolución dilatada se utilizan para extraer características de diferentes campos receptivos. En segundo lugar, el módulo DDA tuvo como objetivo mejorar las relaciones entre características de diferentes niveles aprovechando conexiones densas para obtener información de características de alta calidad. Finalmente, se utilizaron dos modos de interacción para la agregación de doble flujo para generar mapas de saliencia. Experimentos extensos en 5 conjuntos de datos de referencia muestran que el modelo propuesto se desempeña favorablemente frente a 15 métodos de vanguardia.