DBDST-Net: Red de Transferencia de Estilo de Imagen Desacoplada de Doble Rama
Autores: Su, Na; Wang, Jingtao; Zhang, Jingjing; Li, Ying; Pan, Yun
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
DBDST-Net: Red de Transferencia de Estilo de Imagen Desacoplada de Doble Rama
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Tarea de transferencia de estilo de imagen
Imagen de contenido
Características de estilo
Módulos de transferencia de características
Separación de contenido
Representaciones de estilo
Red de Transferencia de Estilo de Imagen Desacoplada de Doble Rama
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La tarea de transferencia de estilo de imagen tiene como objetivo aplicar las características de estilo de una imagen de referencia a una imagen de contenido, generando un nuevo resultado estilizado. Si bien muchos métodos existentes se centran en diseñar módulos de transferencia de características y han logrado resultados prometedores, a menudo pasan por alto el entrelazado entre las características de contenido y estilo después de la transferencia, lo que hace que la separación efectiva sea un desafío. Para abordar este problema, proponemos una Red de Transferencia de Estilo de Imagen Desacoplada de Doble Rama (DBDST-Net) para desentrelazar mejor las representaciones de contenido y estilo. La red consta de dos ramas: una Rama de Desacoplamiento de Características de Contenido, que captura estructuras de contenido de grano fino para una separación de contenido más precisa, y una Rama de Desacoplamiento de Características de Estilo, que mejora la sensibilidad a atributos específicos del estilo. Para mejorar aún más el rendimiento del desacoplamiento, introducimos una pérdida densa-regresiva que minimiza la discrepancia entre la imagen de contenido original y el contenido reconstruido a partir de la salida estilizada, promoviendo así la independencia de las características de contenido y estilo mientras se mejora la calidad de la imagen. Además, para mitigar la disponibilidad limitada de datos de estilo, empleamos el modelo de Difusión Estable para generar muestras estilizadas para la augmentación de datos. Experimentos extensos demuestran que nuestro método logra un mejor equilibrio entre la preservación del contenido y la representación del estilo en comparación con enfoques existentes.
Descripción
La tarea de transferencia de estilo de imagen tiene como objetivo aplicar las características de estilo de una imagen de referencia a una imagen de contenido, generando un nuevo resultado estilizado. Si bien muchos métodos existentes se centran en diseñar módulos de transferencia de características y han logrado resultados prometedores, a menudo pasan por alto el entrelazado entre las características de contenido y estilo después de la transferencia, lo que hace que la separación efectiva sea un desafío. Para abordar este problema, proponemos una Red de Transferencia de Estilo de Imagen Desacoplada de Doble Rama (DBDST-Net) para desentrelazar mejor las representaciones de contenido y estilo. La red consta de dos ramas: una Rama de Desacoplamiento de Características de Contenido, que captura estructuras de contenido de grano fino para una separación de contenido más precisa, y una Rama de Desacoplamiento de Características de Estilo, que mejora la sensibilidad a atributos específicos del estilo. Para mejorar aún más el rendimiento del desacoplamiento, introducimos una pérdida densa-regresiva que minimiza la discrepancia entre la imagen de contenido original y el contenido reconstruido a partir de la salida estilizada, promoviendo así la independencia de las características de contenido y estilo mientras se mejora la calidad de la imagen. Además, para mitigar la disponibilidad limitada de datos de estilo, empleamos el modelo de Difusión Estable para generar muestras estilizadas para la augmentación de datos. Experimentos extensos demuestran que nuestro método logra un mejor equilibrio entre la preservación del contenido y la representación del estilo en comparación con enfoques existentes.