CGFTNet: Red de Transformación en el Dominio de Frecuencia Guiada por Contenido para la Super-Resolución Facial
Autores: Yekeben, Yeerlan; Cheng, Shuli; Du, Anyu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
CGFTNet: Red de Transformación en el Dominio de Frecuencia Guiada por Contenido para la Super-Resolución Facial
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Avances
Superresolución facial
Técnicas de aprendizaje profundo
Redes neuronales convolucionales
Red de transformación en el dominio de frecuencia guiada por contenido
Calidad de imagen
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los recientes avances en la superresolución facial (FSR) han sido impulsados por técnicas de aprendizaje profundo utilizando redes neuronales convolucionales (CNN). Sin embargo, los métodos existentes aún tienen dificultades para capturar de manera efectiva la información global de la estructura facial, lo que lleva a una fidelidad reducida en las imágenes reconstruidas y, a menudo, requieren anotación manual de datos adicional. Para superar estos desafíos, introducimos una red de transformación en el dominio de frecuencia guiada por contenido (CGFTNet) para tareas de superresolución facial. La red presenta una arquitectura de codificador-decodificador vinculada a la atención de canales con dos componentes clave: el módulo de Mejora de Características de Convolución de Enfoque Reparametrizado en el Dominio de Frecuencia (FDRFEM) y el módulo de Fusión de Atención de Canales Guiada por Contenido (CGCAF). FDRFEM mejora la representación de características a través de técnicas del dominio de transformación y convolución de enfoque reparametrizado (RefConv), capturando características faciales detalladas y mejorando la calidad de la imagen. CGCAF ajusta dinámicamente la fusión de características en función del contenido de la imagen, mejorando la restauración de detalles. Evaluaciones extensas en múltiples conjuntos de datos demuestran que la CGFTNet propuesta supera consistentemente a otros métodos de vanguardia.
Descripción
Los recientes avances en la superresolución facial (FSR) han sido impulsados por técnicas de aprendizaje profundo utilizando redes neuronales convolucionales (CNN). Sin embargo, los métodos existentes aún tienen dificultades para capturar de manera efectiva la información global de la estructura facial, lo que lleva a una fidelidad reducida en las imágenes reconstruidas y, a menudo, requieren anotación manual de datos adicional. Para superar estos desafíos, introducimos una red de transformación en el dominio de frecuencia guiada por contenido (CGFTNet) para tareas de superresolución facial. La red presenta una arquitectura de codificador-decodificador vinculada a la atención de canales con dos componentes clave: el módulo de Mejora de Características de Convolución de Enfoque Reparametrizado en el Dominio de Frecuencia (FDRFEM) y el módulo de Fusión de Atención de Canales Guiada por Contenido (CGCAF). FDRFEM mejora la representación de características a través de técnicas del dominio de transformación y convolución de enfoque reparametrizado (RefConv), capturando características faciales detalladas y mejorando la calidad de la imagen. CGCAF ajusta dinámicamente la fusión de características en función del contenido de la imagen, mejorando la restauración de detalles. Evaluaciones extensas en múltiples conjuntos de datos demuestran que la CGFTNet propuesta supera consistentemente a otros métodos de vanguardia.