Red de generador de dos etapas para rellenar imágenes de alta calidad en Internet del futuro
Autores: Zhao, Peng; Zhang, Dan; Geng, Shengling; Zhou, Mingquan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Red de generador de dos etapas para rellenar imágenes de alta calidad en Internet del futuro
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Nitidez
Relleno de imagen
Método basado en transformadores
Consistencia de bordes
Mecanismo de autoatención
Alta resolución.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
La nitidez es un factor importante para el relleno de imágenes en el futuro de Internet, pero los masivos parámetros del modelo involucrados pueden producir una consistencia de bordes insuficiente y reducir la calidad de la imagen. En este artículo, proponemos un método de relleno de imágenes de alta resolución basado en transformadores de dos etapas para abordar este problema. Este modelo consta de una red generadora gruesa y fina. Se introduce un mecanismo de autoatención para guiar la transformación de semántica de orden superior a través de las capas de la red, acelerar la propagación hacia adelante y reducir el costo computacional. Se aplica un mecanismo de atención de múltiples cabezas adaptativo a la red fina para controlar la entrada de las características con el fin de reducir los cálculos redundantes durante el entrenamiento. La pirámide y la percepción se fusionan como la función de pérdida de la red generadora para mejorar la eficiencia del modelo. La comparación con Pennet, GapNet y Partial muestra la importancia del método propuesto en la reducción de la escala de parámetros y la mejora de la resolución y los detalles de textura de la imagen rellenada.
Descripción
La nitidez es un factor importante para el relleno de imágenes en el futuro de Internet, pero los masivos parámetros del modelo involucrados pueden producir una consistencia de bordes insuficiente y reducir la calidad de la imagen. En este artículo, proponemos un método de relleno de imágenes de alta resolución basado en transformadores de dos etapas para abordar este problema. Este modelo consta de una red generadora gruesa y fina. Se introduce un mecanismo de autoatención para guiar la transformación de semántica de orden superior a través de las capas de la red, acelerar la propagación hacia adelante y reducir el costo computacional. Se aplica un mecanismo de atención de múltiples cabezas adaptativo a la red fina para controlar la entrada de las características con el fin de reducir los cálculos redundantes durante el entrenamiento. La pirámide y la percepción se fusionan como la función de pérdida de la red generadora para mejorar la eficiencia del modelo. La comparación con Pennet, GapNet y Partial muestra la importancia del método propuesto en la reducción de la escala de parámetros y la mejora de la resolución y los detalles de textura de la imagen rellenada.