Memorizando la red de denoising Swin-Transformer para el modelo de difusión
Autores: Chen, Jindou; Shen, Yiqing
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Memorizando la red de denoising Swin-Transformer para el modelo de difusión
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Modelos de difusión
Generación de imágenes
Swin-Transformer
Arquitectura de red de denoising
K-Vecinos más Cercanos
Señales temporales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 50
Citaciones: Sin citaciones
Los modelos de difusión han captado una atención significativa en el campo de la generación de imágenes. Sin embargo, las arquitecturas de eliminación de ruido existentes, como U-Net, enfrentan limitaciones en la captura del contexto global, mientras que los Transformadores de Visión (ViTs) pueden tener dificultades con los campos receptivos locales. Para abordar estos desafíos, proponemos una novedosa arquitectura de red de eliminación de ruido basada en Swin-Transformer que aprovecha las fortalezas tanto de U-Net como de ViT.
Descripción
Los modelos de difusión han captado una atención significativa en el campo de la generación de imágenes. Sin embargo, las arquitecturas de eliminación de ruido existentes, como U-Net, enfrentan limitaciones en la captura del contexto global, mientras que los Transformadores de Visión (ViTs) pueden tener dificultades con los campos receptivos locales. Para abordar estos desafíos, proponemos una novedosa arquitectura de red de eliminación de ruido basada en Swin-Transformer que aprovecha las fortalezas tanto de U-Net como de ViT.