Red de atención profunda guiada por métricas perceptuales para la superresolución de imágenes individuales

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Red de atención profunda guiada por métricas perceptuales para la superresolución de imágenes individuales

Autores: Sun, Yubao; Shi, Yuyang; Yang, Ying; Zhou, Wangping

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico

2020

Red de atención profunda guiada por métricas perceptuales para la superresolución de imágenes individuales

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje profundo

Super resolución de imágenes

Parámetros de red

Red codificador-decodificador basada en atención

Métrica perceptual

Unidades RSA

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones

El aprendizaje profundo se ha aplicado ampliamente a tareas de super-resolución de imágenes (SR) y ha logrado un rendimiento superior a los métodos tradicionales debido a sus excelentes capacidades de aprendizaje de características. Sin embargo, la mayoría de estos métodos basados en aprendizaje profundo requieren conjuntos de imágenes de entrenamiento para pre-entrenar los parámetros de la red SR. En este documento, proponemos una nueva red de SR de imagen única sin necesidad de ningún pre-entrenamiento. La red propuesta está optimizada para lograr la reconstrucción de SR solo a partir de una observación de baja resolución en lugar de conjuntos de imágenes de entrenamiento, y se enfoca en mejorar la calidad visual de las imágenes reconstruidas. Específicamente, diseñamos una red codificador-decodificador basada en atención para predecir la reconstrucción de SR, en la cual se despliega una unidad de atención espacial residual (RSA) en cada capa del decodificador para capturar información clave. Además, adoptamos la métrica perceptual que consiste en la métrica L1 y la métrica de similitud estructural a múltiples escalas (MSSSIM) para aprender los parámetros de la red. A diferencia de la métrica convencional MSE (error cuadrático medio), la métrica perceptual coincide bien con las características perceptuales del sistema visual humano. Bajo la guía de la métrica perceptual, las unidades RSA son capaces de predecir las áreas visualmente sensibles en diferentes escalas. La red propuesta puede así prestar más atención a estas áreas para preservar estructuras informativas visuales en múltiples escalas. Los resultados experimentales en los conjuntos de imágenes Set5 y Set14 demuestran que la combinación de la métrica perceptual y las unidades RSA puede mejorar significativamente la calidad de la reconstrucción. En cuanto a los valores de PSNR y similitud estructural (SSIM), el método propuesto logra mejores resultados de reconstrucción que los trabajos relacionados, e incluso es comparable a algunas redes pre-entrenadas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro