logo móvil
Contáctanos

Red de atención profunda guiada por métricas perceptuales para la superresolución de imágenes individuales

Autores: Sun, Yubao; Shi, Yuyang; Yang, Ying; Zhou, Wangping

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Red de atención profunda guiada por métricas perceptuales para la superresolución de imágenes individuales


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje profundo
Super resolución de imágenes
Parámetros de red
Red codificador-decodificador basada en atención
Métrica perceptual
Unidades RSA

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones


Descripción
El aprendizaje profundo se ha aplicado ampliamente a tareas de super-resolución de imágenes (SR) y ha logrado un rendimiento superior a los métodos tradicionales debido a sus excelentes capacidades de aprendizaje de características. Sin embargo, la mayoría de estos métodos basados en aprendizaje profundo requieren conjuntos de imágenes de entrenamiento para pre-entrenar los parámetros de la red SR. En este documento, proponemos una nueva red de SR de imagen única sin necesidad de ningún pre-entrenamiento. La red propuesta está optimizada para lograr la reconstrucción de SR solo a partir de una observación de baja resolución en lugar de conjuntos de imágenes de entrenamiento, y se enfoca en mejorar la calidad visual de las imágenes reconstruidas. Específicamente, diseñamos una red codificador-decodificador basada en atención para predecir la reconstrucción de SR, en la cual se despliega una unidad de atención espacial residual (RSA) en cada capa del decodificador para capturar información clave. Además, adoptamos la métrica perceptual que consiste en la métrica L1 y la métrica de similitud estructural a múltiples escalas (MSSSIM) para aprender los parámetros de la red. A diferencia de la métrica convencional MSE (error cuadrático medio), la métrica perceptual coincide bien con las características perceptuales del sistema visual humano. Bajo la guía de la métrica perceptual, las unidades RSA son capaces de predecir las áreas visualmente sensibles en diferentes escalas. La red propuesta puede así prestar más atención a estas áreas para preservar estructuras informativas visuales en múltiples escalas. Los resultados experimentales en los conjuntos de imágenes Set5 y Set14 demuestran que la combinación de la métrica perceptual y las unidades RSA puede mejorar significativamente la calidad de la reconstrucción. En cuanto a los valores de PSNR y similitud estructural (SSIM), el método propuesto logra mejores resultados de reconstrucción que los trabajos relacionados, e incluso es comparable a algunas redes pre-entrenadas.

Otros recursos que podrían interesarte

Temas Virtualpro