logo móvil
Contáctanos

Modelo integrado de edición de atributos faciales con atención múltiple: mejorando la robustez de la manipulación de atributos faciales

Autores: Lin, Zhijie; Xu, Wangjun; Ma, Xiaolong; Xu, Caie; Xiao, Han

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Modelo integrado de edición de atributos faciales con atención múltiple: mejorando la robustez de la manipulación de atributos faciales


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Edición de atributos faciales
Redes generativas adversariales
Arquitecturas codificador-decodificador
Atributos faciales objetivo
Mecanismo de atención discriminatorio
MAGAN

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 40

Citaciones: Sin citaciones


Descripción
La edición de atributos faciales se refiere a la tarea de modificar imágenes faciales alterando atributos faciales específicos. Los enfoques existentes suelen depender de la combinación de redes generativas adversariales y arquitecturas codificador-decodificador para abordar este problema. Sin embargo, los métodos actuales pueden mostrar una precisión limitada al tratar ciertos atributos. El objetivo principal de esta investigación es mejorar la modificación de imágenes faciales basada en atributos faciales específicos especificados por el usuario, como el color del cabello, la eliminación de barba o la transformación de género. Durante el proceso de edición, es crucial modificar selectivamente solo las regiones relevantes a los atributos objetivo mientras se preservan los detalles de otros atributos faciales no relacionados. Esto asegura que los resultados de la edición parezcan más naturales y realistas. Este estudio presenta un enfoque novedoso llamado MAGAN (Combinando Estructura GRU y Atención Aditiva con Unidades de Puerta Adaptativas AGU). Además, se introduce un mecanismo de atención discriminativa para identificar automáticamente regiones clave en las imágenes de entrada que son relevantes para los atributos faciales. Este mecanismo concentra la atención en estas regiones, mejorando la capacidad del modelo para capturar y analizar con precisión las características sutiles de los atributos faciales. El método incorpora atención externa dentro de las capas convolucionales de la arquitectura codificador-decodificador, facilitando la modelización de complejidad lineal en regiones de la imagen y considerando implícitamente las correlaciones entre todas las muestras de datos. Al emplear atención discriminativa en el discriminador, el modelo logra una edición de atributos más precisa. Para evaluar la efectividad de MAGAN, se realizaron experimentos en el conjunto de datos CelebA. La precisión promedio de generación de atributos faciales en imágenes editadas por nuestro modelo es del 91.83%. El PSNR y el SSIM para imágenes reconstruidas son de 32.52 y 0.957, respectivamente. En comparación con metodologías existentes (AttGAN, STGAN, MUGAN), se han logrado mejoras notables en el ámbito de la manipulación de atributos faciales.

Otros recursos que podrían interesarte

Temas Virtualpro