Estugan: transformador de natación mejorado con discriminador U-Net para super resolución de imágenes de teledetección
Autores: Yu, Chunhe; Hong, Lingyue; Pan, Tianpeng; Li, Yufeng; Li, Tingting
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estugan: transformador de natación mejorado con discriminador U-Net para super resolución de imágenes de teledetección
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Imagen de teledetección de superresolución
Algoritmos
Limitaciones
ESTUGAN
Transformador Swin
Discriminador U-Net
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La imagen de percepción remota de súper resolución (SR) es un tema de investigación práctico con amplias aplicaciones. Sin embargo, los algoritmos principales para esta tarea sufren de limitaciones. Los algoritmos basados en CNN enfrentan dificultades para modelar dependencias a largo plazo, mientras que las redes generativas adversarias (GANs) tienden a producir artefactos, lo que dificulta la reconstrucción de imágenes detalladas de alta calidad. Para abordar estos desafíos, proponemos ESTUGAN para la percepción remota de imagen SR. Por un lado, ESTUGAN adopta el Transformador Swin como la columna vertebral de la red y lo actualiza para movilizar completamente la información de entrada para una interacción global, logrando un rendimiento impresionante con menos parámetros. Por otro lado, empleamos un discriminador U-Net con la estrategia de aprendizaje consciente de la región para la supervisión asistida. El diseño en forma de U nos permite obtener información estructural en cada jerarquía y proporciona una retroalimentación densa píxel por píxel sobre las imágenes predichas. Combinado con la estrategia de aprendizaje consciente de la región, nuestro discriminador U-Net puede realizar un aprendizaje adversarial solo para regiones ricas en textura, suprimiendo efectivamente artefactos. Para lograr una supervisión flexible para la estimación, empleamos la pérdida de Mejor amigo. Y también agregamos la pérdida de Retroproyección como una restricción para la reconstrucción fiel de la distribución de imágenes de alta resolución. Experimentos extensos demuestran la calidad perceptual superior y la confiabilidad de nuestro ESTUGAN propuesto en la reconstrucción de imágenes de percepción remota.
Descripción
La imagen de percepción remota de súper resolución (SR) es un tema de investigación práctico con amplias aplicaciones. Sin embargo, los algoritmos principales para esta tarea sufren de limitaciones. Los algoritmos basados en CNN enfrentan dificultades para modelar dependencias a largo plazo, mientras que las redes generativas adversarias (GANs) tienden a producir artefactos, lo que dificulta la reconstrucción de imágenes detalladas de alta calidad. Para abordar estos desafíos, proponemos ESTUGAN para la percepción remota de imagen SR. Por un lado, ESTUGAN adopta el Transformador Swin como la columna vertebral de la red y lo actualiza para movilizar completamente la información de entrada para una interacción global, logrando un rendimiento impresionante con menos parámetros. Por otro lado, empleamos un discriminador U-Net con la estrategia de aprendizaje consciente de la región para la supervisión asistida. El diseño en forma de U nos permite obtener información estructural en cada jerarquía y proporciona una retroalimentación densa píxel por píxel sobre las imágenes predichas. Combinado con la estrategia de aprendizaje consciente de la región, nuestro discriminador U-Net puede realizar un aprendizaje adversarial solo para regiones ricas en textura, suprimiendo efectivamente artefactos. Para lograr una supervisión flexible para la estimación, empleamos la pérdida de Mejor amigo. Y también agregamos la pérdida de Retroproyección como una restricción para la reconstrucción fiel de la distribución de imágenes de alta resolución. Experimentos extensos demuestran la calidad perceptual superior y la confiabilidad de nuestro ESTUGAN propuesto en la reconstrucción de imágenes de percepción remota.