Psrgan: red generativa antagónica de súper resolución de imágenes orientada a percepción y diseño
Autores: Wu, Tao; Xiong, Shuo; Liu, Hui; Zhao, Yangyang; Tuo, Haoran; Li, Yi; Zhang, Jiaxin; Liu, Huaizheng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Psrgan: red generativa antagónica de súper resolución de imágenes orientada a percepción y diseño
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes generativas adversarias de última generación
Orientado al diseño de percepción
PSRGAN
Características multi-escala
Calidad perceptual
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Entre los algoritmos inteligentes de superresolución de imágenes realistas de última generación, las redes generativas adversariales (GANs) han logrado un impresionante rendimiento visual. Sin embargo, ha existido el problema de una percepción insatisfactoria de imágenes súper puntuadas con artefactos desagradables. Para abordar este problema y mejorar aún más la calidad visual, propusimos un PSRGAN orientado al diseño de percepción con dobles turbos de percepción para SR del mundo real. El primer turbo de percepción en la red generadora tiene una estructura de percepción de tres niveles con diferentes tamaños de kernel de convolución, que puede extraer características multi-escala de subimágenes de cuatro tamaños cortadas por la imagen LR original. La operación de corte expande las muestras adversariales a cuatro y podría aliviar los artefactos durante el entrenamiento de GAN. Las características extraídas finalmente se concatenarán en procesos de upsampling posteriores de 3 x 2 a través de pixel shuffle para restaurar la imagen SR con texturas delicadas diversificadas. El segundo turbo de percepción en los discriminadores tiene bloques de turbo de percepción en cascada (PTBs), que podrían percibir aún más características multi-escala en varias relaciones espaciales y promover que el generador restaure texturas sutiles impulsadas por GAN. En comparación con los métodos SR recientes (BSRGAN, real-ESRGAN, PDM_SR, SwinIR, LDL, etc.), realizamos una extensa prueba con un factor de aumento en varios conjuntos de datos (OST300, 2020track1, RealSR-Canon, RealSR-Nikon, etc.). Realizamos una serie de experimentos que muestran que nuestro PSRGAN propuesto basado en redes generativas adversariales supera a los actuales algoritmos inteligentes de última generación en varias métricas de evaluación, incluidas NIQE, NRQM y PI. En términos de visualización, PSRGAN genera texturas más finas y naturales mientras suprime artefactos desagradables y logra mejoras significativas en la calidad perceptual.
Descripción
Entre los algoritmos inteligentes de superresolución de imágenes realistas de última generación, las redes generativas adversariales (GANs) han logrado un impresionante rendimiento visual. Sin embargo, ha existido el problema de una percepción insatisfactoria de imágenes súper puntuadas con artefactos desagradables. Para abordar este problema y mejorar aún más la calidad visual, propusimos un PSRGAN orientado al diseño de percepción con dobles turbos de percepción para SR del mundo real. El primer turbo de percepción en la red generadora tiene una estructura de percepción de tres niveles con diferentes tamaños de kernel de convolución, que puede extraer características multi-escala de subimágenes de cuatro tamaños cortadas por la imagen LR original. La operación de corte expande las muestras adversariales a cuatro y podría aliviar los artefactos durante el entrenamiento de GAN. Las características extraídas finalmente se concatenarán en procesos de upsampling posteriores de 3 x 2 a través de pixel shuffle para restaurar la imagen SR con texturas delicadas diversificadas. El segundo turbo de percepción en los discriminadores tiene bloques de turbo de percepción en cascada (PTBs), que podrían percibir aún más características multi-escala en varias relaciones espaciales y promover que el generador restaure texturas sutiles impulsadas por GAN. En comparación con los métodos SR recientes (BSRGAN, real-ESRGAN, PDM_SR, SwinIR, LDL, etc.), realizamos una extensa prueba con un factor de aumento en varios conjuntos de datos (OST300, 2020track1, RealSR-Canon, RealSR-Nikon, etc.). Realizamos una serie de experimentos que muestran que nuestro PSRGAN propuesto basado en redes generativas adversariales supera a los actuales algoritmos inteligentes de última generación en varias métricas de evaluación, incluidas NIQE, NRQM y PI. En términos de visualización, PSRGAN genera texturas más finas y naturales mientras suprime artefactos desagradables y logra mejoras significativas en la calidad perceptual.