Detección de objetos destacados combinando un módulo de autoatención y una red de pirámide de características
Autores: Ren, Guangyu; Dai, Tianhong; Barmpoutis, Panagiotis; Stathaki, Tania
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Detección de objetos destacados combinando un módulo de autoatención y una red de pirámide de características
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de objetos destacados
Redes completamente convolucionales
Problemas de dilución
Módulo de autoatención piramidal
Estrategia de complementación de características
Información semántica de alto nivel.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La detección de objetos destacados ha logrado grandes mejoras al utilizar las Redes Convolucionales Completamente Convolucionales (FCNs). Sin embargo, la arquitectura en forma de U basada en FCN puede causar problemas de dilución en la información semántica de alto nivel durante las operaciones de aumento de tamaño en la vía de arriba hacia abajo. Por lo tanto, puede debilitar la capacidad de localización de objetos destacados y producir límites degradados. A este respecto, con el fin de superar esta limitación, proponemos un módulo novedoso de autoatención piramidal (PSAM) y la adopción de una estrategia independiente de complementación de características. En PSAM, se equipan capas de autoatención después de características piramidales de múltiples escalas para capturar características de alto nivel más ricas y aportar campos receptivos más grandes al modelo. Además, también se emplea un módulo de atención por canal para reducir las características redundantes de FPN y proporcionar resultados refinados. El análisis experimental demuestra que el PSAM propuesto contribuye de manera efectiva al modelo completo, superando los resultados de vanguardia en cinco conjuntos de datos desafiantes. Finalmente, los resultados cuantitativos muestran que PSAM genera predicciones precisas y mapas de objetos destacados integrales, lo que puede proporcionar ayuda adicional a otras tareas de visión por computadora, como la detección de objetos y la segmentación semántica.
Descripción
La detección de objetos destacados ha logrado grandes mejoras al utilizar las Redes Convolucionales Completamente Convolucionales (FCNs). Sin embargo, la arquitectura en forma de U basada en FCN puede causar problemas de dilución en la información semántica de alto nivel durante las operaciones de aumento de tamaño en la vía de arriba hacia abajo. Por lo tanto, puede debilitar la capacidad de localización de objetos destacados y producir límites degradados. A este respecto, con el fin de superar esta limitación, proponemos un módulo novedoso de autoatención piramidal (PSAM) y la adopción de una estrategia independiente de complementación de características. En PSAM, se equipan capas de autoatención después de características piramidales de múltiples escalas para capturar características de alto nivel más ricas y aportar campos receptivos más grandes al modelo. Además, también se emplea un módulo de atención por canal para reducir las características redundantes de FPN y proporcionar resultados refinados. El análisis experimental demuestra que el PSAM propuesto contribuye de manera efectiva al modelo completo, superando los resultados de vanguardia en cinco conjuntos de datos desafiantes. Finalmente, los resultados cuantitativos muestran que PSAM genera predicciones precisas y mapas de objetos destacados integrales, lo que puede proporcionar ayuda adicional a otras tareas de visión por computadora, como la detección de objetos y la segmentación semántica.