Detección de objetos utilizando una red piramidal de características bidireccionales mejorada
Autores: Quang, Tran Ngoc; Lee, Seunghyun; Song, Byung Cheol
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de objetos utilizando una red piramidal de características bidireccionales mejorada
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Convencionales
Detectores de objetos de una sola etapa
Red de pirámide de características
Esquema de agregación
Información global
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Los detectores de objetos convencionales de una sola etapa han podido detectar eficientemente objetos de varios tamaños utilizando una red de pirámide de características. Sin embargo, debido a que adoptan una forma demasiado simple de agregar mapas de características, no pueden evitar la degradación del rendimiento debido a la pérdida de información. Para resolver este problema, este documento propone un nuevo marco para la detección de objetos de una sola etapa. El esquema de agregación propuesto introduce dos módulos independientes para extraer información global y local. Primero, el extractor de información global está diseñado para que cada vector de características pueda reflejar la información de toda la imagen a través de una red neuronal no local (NLNN). A continuación, el extractor de información local agrega cada mapa de características de manera más efectiva a través de la red bidireccional mejorada. El método propuesto puede lograr un mejor rendimiento que los métodos de detección de objetos de una sola etapa existentes al proporcionar mapas de características mejorados a las cabezas de detección. Por ejemplo, el método propuesto muestra un 1,6% más de precisión promedio (AP) que la red de pirámide de imágenes eficientes featurizada (EFIPNet) para el conjunto de datos de MicroSoft Common Objects in COntext (MS COCO).
Descripción
Los detectores de objetos convencionales de una sola etapa han podido detectar eficientemente objetos de varios tamaños utilizando una red de pirámide de características. Sin embargo, debido a que adoptan una forma demasiado simple de agregar mapas de características, no pueden evitar la degradación del rendimiento debido a la pérdida de información. Para resolver este problema, este documento propone un nuevo marco para la detección de objetos de una sola etapa. El esquema de agregación propuesto introduce dos módulos independientes para extraer información global y local. Primero, el extractor de información global está diseñado para que cada vector de características pueda reflejar la información de toda la imagen a través de una red neuronal no local (NLNN). A continuación, el extractor de información local agrega cada mapa de características de manera más efectiva a través de la red bidireccional mejorada. El método propuesto puede lograr un mejor rendimiento que los métodos de detección de objetos de una sola etapa existentes al proporcionar mapas de características mejorados a las cabezas de detección. Por ejemplo, el método propuesto muestra un 1,6% más de precisión promedio (AP) que la red de pirámide de imágenes eficientes featurizada (EFIPNet) para el conjunto de datos de MicroSoft Common Objects in COntext (MS COCO).