Un método de síntesis diversificada de estilo de imagen basado en redes generativas adversarias
Autores: Yang, Zujian; Qiu, Zhao
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un método de síntesis diversificada de estilo de imagen basado en redes generativas adversarias
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Conversión de imágenes
Redes generativas adversarias
Múltiples dominios
Escalabilidad
Conjuntos de datos
Criterios de evaluación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La investigación existente muestra que hay muchos métodos maduros para la conversión de imágenes en diferentes campos. Sin embargo, cuando los métodos existentes tratan con imágenes en múltiples dominios de imágenes, la robustez y escalabilidad de las imágenes suelen ser limitadas. Proponemos un enfoque novedoso y escalable, utilizando un modelo de redes generativas adversarias (GANs) que puede transformar imágenes en múltiples dominios, para abordar las limitaciones mencionadas anteriormente. Nuestro modelo puede ser entrenado en conjuntos de datos de imágenes con diferentes dominios en una sola red, con la capacidad de traducir imágenes y la capacidad de traducir de manera flexible las imágenes de entrada a cualquier dominio objetivo deseado. Nuestro modelo está principalmente compuesto por un generador, un discriminador, un codificador de estilo y una red de mapeo. Los conjuntos de datos utilizan el conjunto de datos de rostros de celebridades CelebA-HQ y el conjunto de datos de rostros de animales AFHQ, y los criterios de evaluación utilizan FID y LPIPS para evaluar las imágenes generadas por el modelo. Los experimentos muestran que nuestro modelo puede generar una amplia variedad de imágenes de alta calidad, y aún hay margen para mejorar.
Descripción
La investigación existente muestra que hay muchos métodos maduros para la conversión de imágenes en diferentes campos. Sin embargo, cuando los métodos existentes tratan con imágenes en múltiples dominios de imágenes, la robustez y escalabilidad de las imágenes suelen ser limitadas. Proponemos un enfoque novedoso y escalable, utilizando un modelo de redes generativas adversarias (GANs) que puede transformar imágenes en múltiples dominios, para abordar las limitaciones mencionadas anteriormente. Nuestro modelo puede ser entrenado en conjuntos de datos de imágenes con diferentes dominios en una sola red, con la capacidad de traducir imágenes y la capacidad de traducir de manera flexible las imágenes de entrada a cualquier dominio objetivo deseado. Nuestro modelo está principalmente compuesto por un generador, un discriminador, un codificador de estilo y una red de mapeo. Los conjuntos de datos utilizan el conjunto de datos de rostros de celebridades CelebA-HQ y el conjunto de datos de rostros de animales AFHQ, y los criterios de evaluación utilizan FID y LPIPS para evaluar las imágenes generadas por el modelo. Los experimentos muestran que nuestro modelo puede generar una amplia variedad de imágenes de alta calidad, y aún hay margen para mejorar.