Completado de imagen facial basado en prioridad GAN
Autores: Shao, Xiaofeng; Qiang, Zhenping; Dai, Fei; He, Libo; Lin, Hong
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Completado de imagen facial basado en prioridad GAN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Imágenes faciales
Completado de imágenes
Rostros humanos
Métodos de relleno basados en aprendizaje profundo
Priori de GAN
Modelo de red
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Las imágenes faciales suelen utilizarse en actividades sociales y de entretenimiento para interactuar con la información. Sin embargo, durante la transmisión de imágenes digitales, existen factores que pueden destruir u oscurecer los elementos clave de la imagen, lo que puede dificultar la comprensión del contenido de la imagen. Por lo tanto, el estudio de la completación de imágenes de rostros humanos se ha convertido en una rama de investigación importante en el campo del procesamiento de imágenes por computadora. Comparado con los métodos tradicionales de rellenado de imágenes, los métodos de rellenado basados en el aprendizaje profundo han mejorado significativamente los resultados en imágenes faciales, pero en el caso de información semántica compleja y áreas faltantes grandes, los resultados de completación siguen siendo borrosos, y el color del borde es inconsistente y no coincide con la percepción visual humana. Para resolver este problema, este artículo propone un método de completación facial basado en GAN a priori para guiar a la red a completar imágenes faciales utilizando directamente la información a priori rica y diversa en la GAN preentrenada. El modelo de red es una estructura de grueso a fino, donde las imágenes faciales dañadas y las máscaras correspondientes se introducen primero en la red gruesa para obtener los resultados gruesos, y luego los resultados gruesos se introducen en la red fina con conexiones de salto de múltiples resoluciones. La red fina utiliza la información a priori de la GAN preentrenada para guiar a la red a generar las imágenes faciales, y finalmente utiliza el discriminador SN-PatchGAN para evaluar los resultados de completación. El experimento se realiza en el conjunto de datos CelebA-HQ. En comparación con los tres últimos métodos de completación, el análisis experimental cualitativo y cuantitativo muestra que nuestro método tiene una mejora evidente en textura y fidelidad.
Descripción
Las imágenes faciales suelen utilizarse en actividades sociales y de entretenimiento para interactuar con la información. Sin embargo, durante la transmisión de imágenes digitales, existen factores que pueden destruir u oscurecer los elementos clave de la imagen, lo que puede dificultar la comprensión del contenido de la imagen. Por lo tanto, el estudio de la completación de imágenes de rostros humanos se ha convertido en una rama de investigación importante en el campo del procesamiento de imágenes por computadora. Comparado con los métodos tradicionales de rellenado de imágenes, los métodos de rellenado basados en el aprendizaje profundo han mejorado significativamente los resultados en imágenes faciales, pero en el caso de información semántica compleja y áreas faltantes grandes, los resultados de completación siguen siendo borrosos, y el color del borde es inconsistente y no coincide con la percepción visual humana. Para resolver este problema, este artículo propone un método de completación facial basado en GAN a priori para guiar a la red a completar imágenes faciales utilizando directamente la información a priori rica y diversa en la GAN preentrenada. El modelo de red es una estructura de grueso a fino, donde las imágenes faciales dañadas y las máscaras correspondientes se introducen primero en la red gruesa para obtener los resultados gruesos, y luego los resultados gruesos se introducen en la red fina con conexiones de salto de múltiples resoluciones. La red fina utiliza la información a priori de la GAN preentrenada para guiar a la red a generar las imágenes faciales, y finalmente utiliza el discriminador SN-PatchGAN para evaluar los resultados de completación. El experimento se realiza en el conjunto de datos CelebA-HQ. En comparación con los tres últimos métodos de completación, el análisis experimental cualitativo y cuantitativo muestra que nuestro método tiene una mejora evidente en textura y fidelidad.