Cnb net: un enfoque de dos etapas para desenfoque efectivo de imágenes
Autores: Zhang, Xiu; Zheng, Fengbo; Jiang, Lifen; Guo, Haoyu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Cnb net: un enfoque de dos etapas para desenfoque efectivo de imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Imagen borrosa
Desenfoque
Cnb net
Contexto global
Percepciones locales
Fusión de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
El desenfoque de imagen, a menudo causado por el movimiento de la cámara y de los objetos, plantea un desafío significativo en la visión por computadora. El desenfoque de imagen se esfuerza por restaurar la claridad a estas imágenes. Los métodos tradicionales de una sola etapa, si bien son efectivos en el realce de detalles, a menudo descuidan el contexto global en favor de la información local. Sin embargo, ambos aspectos son cruciales, especialmente en escenarios de la vida real donde las imágenes suelen ser grandes y están sujetas a varios tipos de desenfoque. Para abordar esto, presentamos CNB Net, una innovadora red de desenfoque capaz de integrar percepciones globales y locales para una restauración de imágenes mejorada. La red opera en dos etapas, utilizando nuestro Bloque CNB (Convolution and Normalization-Based) y Bloque CNBP (Convolution and Normalization-Based Plus) diseñados especialmente para la extracción de información a múltiples escalas. Se adopta un enfoque de aprendizaje progresivo con un módulo de Selección Activa de Características (FAS) al final de cada etapa que captura información detallada espacial bajo la guía de imágenes reales. El módulo de Fusión de Características de Dos Etapas (TSFF) reduce la pérdida de información causada por operaciones de muestreo mientras enriquece las características a lo largo de las etapas para una mayor robustez. Realizamos experimentos en el conjunto de datos de GoPro y en el conjunto de datos de HIDE. En el conjunto de datos de GoPro, nuestro resultado de Pico de Relación Señal-Ruido (PSNR) es de 32.21 y el resultado de Similitud Estructural (SSIM) es de 0.950; y en el conjunto de datos de HIDE, nuestro resultado de PSNR es de 30.38 y el resultado de SSIM es de 0.932. Nuestros resultados superan a otros algoritmos similares. Al comparar los mapas de características generados, encontramos que nuestro modelo tiene en cuenta tanto la información global como la local de manera efectiva.
Descripción
El desenfoque de imagen, a menudo causado por el movimiento de la cámara y de los objetos, plantea un desafío significativo en la visión por computadora. El desenfoque de imagen se esfuerza por restaurar la claridad a estas imágenes. Los métodos tradicionales de una sola etapa, si bien son efectivos en el realce de detalles, a menudo descuidan el contexto global en favor de la información local. Sin embargo, ambos aspectos son cruciales, especialmente en escenarios de la vida real donde las imágenes suelen ser grandes y están sujetas a varios tipos de desenfoque. Para abordar esto, presentamos CNB Net, una innovadora red de desenfoque capaz de integrar percepciones globales y locales para una restauración de imágenes mejorada. La red opera en dos etapas, utilizando nuestro Bloque CNB (Convolution and Normalization-Based) y Bloque CNBP (Convolution and Normalization-Based Plus) diseñados especialmente para la extracción de información a múltiples escalas. Se adopta un enfoque de aprendizaje progresivo con un módulo de Selección Activa de Características (FAS) al final de cada etapa que captura información detallada espacial bajo la guía de imágenes reales. El módulo de Fusión de Características de Dos Etapas (TSFF) reduce la pérdida de información causada por operaciones de muestreo mientras enriquece las características a lo largo de las etapas para una mayor robustez. Realizamos experimentos en el conjunto de datos de GoPro y en el conjunto de datos de HIDE. En el conjunto de datos de GoPro, nuestro resultado de Pico de Relación Señal-Ruido (PSNR) es de 32.21 y el resultado de Similitud Estructural (SSIM) es de 0.950; y en el conjunto de datos de HIDE, nuestro resultado de PSNR es de 30.38 y el resultado de SSIM es de 0.932. Nuestros resultados superan a otros algoritmos similares. Al comparar los mapas de características generados, encontramos que nuestro modelo tiene en cuenta tanto la información global como la local de manera efectiva.