Un enfoque unificado de desenfoque basado en red invertible en forma de U con representación saliente dispersa en espacio latente
Autores: Wang, Meng; Wen, Tao; Liu, Haipeng
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un enfoque unificado de desenfoque basado en red invertible en forma de U con representación saliente dispersa en espacio latente
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Arquitecturas de aprendizaje profundo
Codificador
Decodificador
Proceso de desenfoque de imagen
Redes invertibles
U-Net
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Las arquitecturas existentes de aprendizaje profundo suelen utilizar un codificador y un decodificador separados para generar las imágenes simuladas deseadas, lo cual es ineficiente para el análisis y síntesis de características. Apuntando al problema de que los métodos existentes no logran utilizar completamente la correlación de los códecs, este artículo se centra en las redes invertibles unificadas de códecs para guiar con precisión el proceso de desenfoque de imágenes controlando las variables latentes. Inspirado en U-Net, se propone una red invertible multi-nivel en forma de U (UML-IN) al integrar las redes invertibles de wavelet en una arquitectura en forma de U supervisada para establecer la correlación de múltiples resoluciones entre las características de imagen borrosa y nítida bajo la guía de una pérdida híbrida. Además, este artículo propone utilizar restricciones de regularización para obtener variables latentes dispersas, aliviando así el problema de dispersión de información causado por la inferencia de alta dimensión en redes invertibles. Finalmente, ajustamos los pesos de los módulos invertibles calculando una pérdida de similitud entre pares de variables de desenfoque-nítido. Experimentos extensos en conjuntos de imágenes borrosas reales y sintéticas muestran que el enfoque propuesto es eficiente y competitivo en comparación con los métodos de vanguardia.
Descripción
Las arquitecturas existentes de aprendizaje profundo suelen utilizar un codificador y un decodificador separados para generar las imágenes simuladas deseadas, lo cual es ineficiente para el análisis y síntesis de características. Apuntando al problema de que los métodos existentes no logran utilizar completamente la correlación de los códecs, este artículo se centra en las redes invertibles unificadas de códecs para guiar con precisión el proceso de desenfoque de imágenes controlando las variables latentes. Inspirado en U-Net, se propone una red invertible multi-nivel en forma de U (UML-IN) al integrar las redes invertibles de wavelet en una arquitectura en forma de U supervisada para establecer la correlación de múltiples resoluciones entre las características de imagen borrosa y nítida bajo la guía de una pérdida híbrida. Además, este artículo propone utilizar restricciones de regularización para obtener variables latentes dispersas, aliviando así el problema de dispersión de información causado por la inferencia de alta dimensión en redes invertibles. Finalmente, ajustamos los pesos de los módulos invertibles calculando una pérdida de similitud entre pares de variables de desenfoque-nítido. Experimentos extensos en conjuntos de imágenes borrosas reales y sintéticas muestran que el enfoque propuesto es eficiente y competitivo en comparación con los métodos de vanguardia.