Modelo integrado de edición de atributos faciales con atención múltiple: mejorando la robustez de la manipulación de atributos faciales

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Modelo integrado de edición de atributos faciales con atención múltiple: mejorando la robustez de la manipulación de atributos faciales

Autores: Lin, Zhijie; Xu, Wangjun; Ma, Xiaolong; Xu, Caie; Xiao, Han

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Modelo integrado de edición de atributos faciales con atención múltiple: mejorando la robustez de la manipulación de atributos faciales

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Edición de atributos faciales

Redes generativas adversariales

Arquitecturas codificador-decodificador

Atributos faciales objetivo

Mecanismo de atención discriminatorio

MAGAN

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 40

Citaciones: Sin citaciones

La edición de atributos faciales se refiere a la tarea de modificar imágenes faciales alterando atributos faciales específicos. Los enfoques existentes suelen depender de la combinación de redes generativas adversariales y arquitecturas codificador-decodificador para abordar este problema. Sin embargo, los métodos actuales pueden mostrar una precisión limitada al tratar ciertos atributos. El objetivo principal de esta investigación es mejorar la modificación de imágenes faciales basada en atributos faciales específicos especificados por el usuario, como el color del cabello, la eliminación de barba o la transformación de género. Durante el proceso de edición, es crucial modificar selectivamente solo las regiones relevantes a los atributos objetivo mientras se preservan los detalles de otros atributos faciales no relacionados. Esto asegura que los resultados de la edición parezcan más naturales y realistas. Este estudio presenta un enfoque novedoso llamado MAGAN (Combinando Estructura GRU y Atención Aditiva con Unidades de Puerta Adaptativas AGU). Además, se introduce un mecanismo de atención discriminativa para identificar automáticamente regiones clave en las imágenes de entrada que son relevantes para los atributos faciales. Este mecanismo concentra la atención en estas regiones, mejorando la capacidad del modelo para capturar y analizar con precisión las características sutiles de los atributos faciales. El método incorpora atención externa dentro de las capas convolucionales de la arquitectura codificador-decodificador, facilitando la modelización de complejidad lineal en regiones de la imagen y considerando implícitamente las correlaciones entre todas las muestras de datos. Al emplear atención discriminativa en el discriminador, el modelo logra una edición de atributos más precisa. Para evaluar la efectividad de MAGAN, se realizaron experimentos en el conjunto de datos CelebA. La precisión promedio de generación de atributos faciales en imágenes editadas por nuestro modelo es del 91.83%. El PSNR y el SSIM para imágenes reconstruidas son de 32.52 y 0.957, respectivamente. En comparación con metodologías existentes (AttGAN, STGAN, MUGAN), se han logrado mejoras notables en el ámbito de la manipulación de atributos faciales.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro