Un enfoque de red neuronal de atención normalizado basado en extracción de características a múltiples escalas para la eliminación de ruido en imágenes
Autores: Wang, Yi; Song, Xiao; Gong, Guanghong; Li, Ni
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un enfoque de red neuronal de atención normalizado basado en extracción de características a múltiples escalas para la eliminación de ruido en imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Inteligencia artificial
Redes neuronales
Red convolucional
Eliminación de ruido en imágenes
Extracción de características a múltiples escalas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
Debido al rápido desarrollo de las técnicas de aprendizaje profundo e inteligencia artificial, la eliminación de ruido a través de redes neuronales ha llamado mucho la atención debido a su flexibilidad y excelentes rendimientos. Sin embargo, para la mayoría de los métodos de eliminación de ruido de redes neuronales convolucionales, el núcleo de convolución es solo de una capa de profundidad, y se descuidan las características de escalas distintas. Además, en la operación de convolución, todos los canales se tratan por igual; no se consideran las relaciones entre canales. En este artículo, proponemos una red neuronal de atención normalizada basada en la extracción de características a múltiples escalas (MFENANN) para la eliminación de ruido en imágenes. En MFENANN, definimos un bloque de extracción de características a múltiples escalas para extraer y combinar características en escalas distintas de la imagen ruidosa. Además, proponemos una red de atención normalizada (NAN) para aprender las relaciones entre canales, lo que suaviza el paisaje de optimización y acelera el proceso de convergencia para entrenar un modelo de atención. Además, introducimos el NAN en la eliminación de ruido de redes neuronales convolucionales, en la que cada canal recibe ganancia; los canales pueden desempeñar diferentes roles en la convolución posterior. Para comprobar la efectividad de la propuesta MFENANN, utilizamos conjuntos de imágenes en escala de grises y en color cuyos niveles de ruido iban de 0 a 75 para realizar los experimentos. Los resultados experimentales muestran que, en comparación con algunos métodos de eliminación de ruido de última generación, las imágenes restauradas de MFENANN tienen mayores relaciones señal-ruido pico (PSNR) e índices de similitud estructural (SSIM) y presentan una mejor apariencia general.
Descripción
Debido al rápido desarrollo de las técnicas de aprendizaje profundo e inteligencia artificial, la eliminación de ruido a través de redes neuronales ha llamado mucho la atención debido a su flexibilidad y excelentes rendimientos. Sin embargo, para la mayoría de los métodos de eliminación de ruido de redes neuronales convolucionales, el núcleo de convolución es solo de una capa de profundidad, y se descuidan las características de escalas distintas. Además, en la operación de convolución, todos los canales se tratan por igual; no se consideran las relaciones entre canales. En este artículo, proponemos una red neuronal de atención normalizada basada en la extracción de características a múltiples escalas (MFENANN) para la eliminación de ruido en imágenes. En MFENANN, definimos un bloque de extracción de características a múltiples escalas para extraer y combinar características en escalas distintas de la imagen ruidosa. Además, proponemos una red de atención normalizada (NAN) para aprender las relaciones entre canales, lo que suaviza el paisaje de optimización y acelera el proceso de convergencia para entrenar un modelo de atención. Además, introducimos el NAN en la eliminación de ruido de redes neuronales convolucionales, en la que cada canal recibe ganancia; los canales pueden desempeñar diferentes roles en la convolución posterior. Para comprobar la efectividad de la propuesta MFENANN, utilizamos conjuntos de imágenes en escala de grises y en color cuyos niveles de ruido iban de 0 a 75 para realizar los experimentos. Los resultados experimentales muestran que, en comparación con algunos métodos de eliminación de ruido de última generación, las imágenes restauradas de MFENANN tienen mayores relaciones señal-ruido pico (PSNR) e índices de similitud estructural (SSIM) y presentan una mejor apariencia general.