Un red dinámico con transformador para la eliminación de ruido en imágenes
Autores: Song, Mingjian; Wang, Wenbo; Zhao, Yue
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un red dinámico con transformador para la eliminación de ruido en imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales convolucionales
Eliminación de ruido de imagen
Transformador
Red dinámica
Bloque residual
Bloque de autoatención multi-cabeza
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Las redes neuronales convolucionales profundas (CNN) pueden lograr un buen rendimiento en la eliminación de ruido en imágenes debido a su superioridad en la extracción de información estructural. Sin embargo, pueden ignorar las relaciones entre píxeles para limitar los efectos en la eliminación de ruido en imágenes. El Transformer, que se enfoca en las relaciones de píxel a píxel, puede resolver efectivamente este problema. Este artículo tiene como objetivo hacer que una CNN y un Transformer se complementen mutuamente en la eliminación de ruido en imágenes. En este estudio, proponemos una red dinámica con Transformer para la eliminación de ruido en imágenes (DTNet), con un bloque residual (RB), un bloque de autoatención de múltiples cabezas (MSAB) y un bloque de mejora dinámica multidimensional (MDEB). En primer lugar, el RB no solo utiliza una CNN, sino que también sienta las bases para la combinación con Transformer. Luego, el MSAB agrega codificación posicional y aplica autoatención de múltiples cabezas, lo que permite la preservación de la información posicional secuencial mientras emplea el Transformer para obtener información global. Finalmente, el MDEB utiliza mejora de dimensiones y convolución dinámica para mejorar la capacidad adaptativa. Los experimentos muestran que nuestro DTNet es superior a algunos métodos existentes para la eliminación de ruido en imágenes.
Descripción
Las redes neuronales convolucionales profundas (CNN) pueden lograr un buen rendimiento en la eliminación de ruido en imágenes debido a su superioridad en la extracción de información estructural. Sin embargo, pueden ignorar las relaciones entre píxeles para limitar los efectos en la eliminación de ruido en imágenes. El Transformer, que se enfoca en las relaciones de píxel a píxel, puede resolver efectivamente este problema. Este artículo tiene como objetivo hacer que una CNN y un Transformer se complementen mutuamente en la eliminación de ruido en imágenes. En este estudio, proponemos una red dinámica con Transformer para la eliminación de ruido en imágenes (DTNet), con un bloque residual (RB), un bloque de autoatención de múltiples cabezas (MSAB) y un bloque de mejora dinámica multidimensional (MDEB). En primer lugar, el RB no solo utiliza una CNN, sino que también sienta las bases para la combinación con Transformer. Luego, el MSAB agrega codificación posicional y aplica autoatención de múltiples cabezas, lo que permite la preservación de la información posicional secuencial mientras emplea el Transformer para obtener información global. Finalmente, el MDEB utiliza mejora de dimensiones y convolución dinámica para mejorar la capacidad adaptativa. Los experimentos muestran que nuestro DTNet es superior a algunos métodos existentes para la eliminación de ruido en imágenes.