Dals: boceto artístico de paisaje basado en difusión
Autores: Kim, Junho; Yang, Heekyung; Min, Kyungha
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Dals: boceto artístico de paisaje basado en difusión
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Marco de trabajo
Modelo de difusión
3cpm
Difusión estable
Controlnet
Lora
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Proponemos un marco que sintetiza bocetos artísticos de paisajes utilizando un enfoque basado en un modelo de difusión. Además, sugerimos un mapa de perspectiva de tres canales (3CPM) que imita la habilidad artística utilizada por artistas reales. Empleamos Difusión Estable, lo que nos lleva a utilizar ControlNet para procesar 3CPM en Difusión Estable. Además, adoptamos el método de Adaptación de Rango Bajo (LoRA) para ajustar finamente nuestro marco, mejorando así la calidad del boceto y resolviendo el problema de restos de color, que es un artefacto frecuentemente observado en las imágenes de bocetos que utilizan modelos de difusión. Implementamos una interfaz de generación de bocetos bimodal: de texto a boceto y de imagen a boceto. Al producir un boceto, se utiliza un token guía para que nuestro método sintetice un boceto artístico en ambos casos. Finalmente, evaluamos nuestro marco utilizando esquemas cualitativos y cuantitativos. Varias imágenes de bocetos sintetizadas por nuestro marco demuestran la excelencia de nuestro estudio.
Descripción
Proponemos un marco que sintetiza bocetos artísticos de paisajes utilizando un enfoque basado en un modelo de difusión. Además, sugerimos un mapa de perspectiva de tres canales (3CPM) que imita la habilidad artística utilizada por artistas reales. Empleamos Difusión Estable, lo que nos lleva a utilizar ControlNet para procesar 3CPM en Difusión Estable. Además, adoptamos el método de Adaptación de Rango Bajo (LoRA) para ajustar finamente nuestro marco, mejorando así la calidad del boceto y resolviendo el problema de restos de color, que es un artefacto frecuentemente observado en las imágenes de bocetos que utilizan modelos de difusión. Implementamos una interfaz de generación de bocetos bimodal: de texto a boceto y de imagen a boceto. Al producir un boceto, se utiliza un token guía para que nuestro método sintetice un boceto artístico en ambos casos. Finalmente, evaluamos nuestro marco utilizando esquemas cualitativos y cuantitativos. Varias imágenes de bocetos sintetizadas por nuestro marco demuestran la excelencia de nuestro estudio.