logo móvil
Contáctanos

Memorizando la red de denoising Swin-Transformer para el modelo de difusión

Autores: Chen, Jindou; Shen, Yiqing

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Memorizando la red de denoising Swin-Transformer para el modelo de difusión


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Modelos de difusión
Generación de imágenes
Swin-Transformer
Arquitectura de red de denoising
K-Vecinos más Cercanos
Señales temporales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 50

Citaciones: Sin citaciones


Descripción
Los modelos de difusión han captado una atención significativa en el campo de la generación de imágenes. Sin embargo, las arquitecturas de eliminación de ruido existentes, como U-Net, enfrentan limitaciones en la captura del contexto global, mientras que los Transformadores de Visión (ViTs) pueden tener dificultades con los campos receptivos locales. Para abordar estos desafíos, proponemos una novedosa arquitectura de red de eliminación de ruido basada en Swin-Transformer que aprovecha las fortalezas tanto de U-Net como de ViT.

Otros recursos que podrían interesarte

Temas Virtualpro