Nsnet: una red neuronal convolucional en forma de n con información multiescala para la reducción de ruido en imágenes
Autores: Li, Yifen; Chen, Yuanyang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Nsnet: una red neuronal convolucional en forma de n con información multiescala para la reducción de ruido en imágenes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelos de aprendizaje profundo
Operadores convolucionales
Rendimiento de eliminación de ruido de imagen
Pérdida de información global
Características multi-escala
Wavelet Haar
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Los modelos de aprendizaje profundo con operadores convolucionales han recibido amplia atención por su buen rendimiento en el desenfoque de imágenes. Sin embargo, dado que la operación convolucional prefiere extraer características locales, las características extraídas pueden perder algo de información global, como textura, estructura y características de color, cuando el objeto en la imagen es grande. Para abordar este problema, este artículo propone una red neuronal convolucional en forma de N con la capacidad de extraer características a múltiples escalas para capturar más información útil y aliviar el problema de pérdida de información global. La red propuesta tiene dos partes principales: una capa de entrada a múltiples escalas y una capa de extracción de características a múltiples escalas. La primera utiliza una onda Haar bidimensional para crear una pirámide de imágenes, que contiene los componentes de alta y baja frecuencia de la imagen corrupta en diferentes escalas. La segunda utiliza una red convolucional en forma de U para extraer características en diferentes escalas de esta pirámide de imágenes. El método establece el error cuadrático medio como función de pérdida y utiliza la estrategia de aprendizaje residual para aprender directamente el ruido de la imagen. En comparación con algunos métodos de desenfoque de imágenes existentes, el método propuesto muestra un buen rendimiento en el desenfoque de imágenes en escala de grises y en color, especialmente en texturas y contornos.
Descripción
Los modelos de aprendizaje profundo con operadores convolucionales han recibido amplia atención por su buen rendimiento en el desenfoque de imágenes. Sin embargo, dado que la operación convolucional prefiere extraer características locales, las características extraídas pueden perder algo de información global, como textura, estructura y características de color, cuando el objeto en la imagen es grande. Para abordar este problema, este artículo propone una red neuronal convolucional en forma de N con la capacidad de extraer características a múltiples escalas para capturar más información útil y aliviar el problema de pérdida de información global. La red propuesta tiene dos partes principales: una capa de entrada a múltiples escalas y una capa de extracción de características a múltiples escalas. La primera utiliza una onda Haar bidimensional para crear una pirámide de imágenes, que contiene los componentes de alta y baja frecuencia de la imagen corrupta en diferentes escalas. La segunda utiliza una red convolucional en forma de U para extraer características en diferentes escalas de esta pirámide de imágenes. El método establece el error cuadrático medio como función de pérdida y utiliza la estrategia de aprendizaje residual para aprender directamente el ruido de la imagen. En comparación con algunos métodos de desenfoque de imágenes existentes, el método propuesto muestra un buen rendimiento en el desenfoque de imágenes en escala de grises y en color, especialmente en texturas y contornos.