Red de pirámide bidireccional para detección de bordes
Autores: Li, Kai; Tian, Yingjie; Wang, Bo; Qi, Zhiquan; Wang, Qi
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Red de pirámide bidireccional para detección de bordes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Representación multi-escala
Detección de bordes
Entrenamiento rápido
Pruebas precisas
Principio de pirámide de imagen
Red de pirámide
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
La representación multi-escala juega un papel crítico en el campo de la detección de bordes. Sin embargo, la mayoría de las investigaciones existentes se centran en uno de dos aspectos: entrenamiento rápido y pruebas precisas. En este documento, proponemos un método multi-escala novedoso para resolver el equilibrio entre ellos. Específicamente, de acuerdo con las estructuras de múltiples flujos y el principio de la pirámide de imagen, construimos una red piramidal de muestreo descendente y una red piramidal de muestreo ascendente liviana para enriquecer la representación multi-escala desde el codificador y el decodificador, respectivamente. A continuación, estas dos redes piramidales y una red de base constituyen nuestra arquitectura general, una red piramidal bidireccional (BDP-Net). Experimentos extensos muestran que en comparación con el modelo de vanguardia, nuestro método podría mejorar la velocidad de entrenamiento en aproximadamente una vez mientras mantiene una precisión de prueba similar. Especialmente, bajo la prueba de una sola escala, nuestro enfoque también alcanza la percepción humana (puntuación de 0.803) en la base de datos BSDS500.
Descripción
La representación multi-escala juega un papel crítico en el campo de la detección de bordes. Sin embargo, la mayoría de las investigaciones existentes se centran en uno de dos aspectos: entrenamiento rápido y pruebas precisas. En este documento, proponemos un método multi-escala novedoso para resolver el equilibrio entre ellos. Específicamente, de acuerdo con las estructuras de múltiples flujos y el principio de la pirámide de imagen, construimos una red piramidal de muestreo descendente y una red piramidal de muestreo ascendente liviana para enriquecer la representación multi-escala desde el codificador y el decodificador, respectivamente. A continuación, estas dos redes piramidales y una red de base constituyen nuestra arquitectura general, una red piramidal bidireccional (BDP-Net). Experimentos extensos muestran que en comparación con el modelo de vanguardia, nuestro método podría mejorar la velocidad de entrenamiento en aproximadamente una vez mientras mantiene una precisión de prueba similar. Especialmente, bajo la prueba de una sola escala, nuestro enfoque también alcanza la percepción humana (puntuación de 0.803) en la base de datos BSDS500.