Mejorando el aprendizaje fronterizo para una mejor reducción de ruido en imágenes
Autores: Ge, Xin; Zhu, Yu; Qi, Liping; Hu, Yaoqi; Sun, Jinqiu; Zhang, Yanning
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Mejorando el aprendizaje fronterizo para una mejor reducción de ruido en imágenes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Redes neuronales profundas
Eliminación de ruido en imágenes
Capas convolucionales
Efectos de borde
Algoritmos de eliminación de ruido por parches
BERUNet
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Las redes neuronales profundas para el filtrado de ruido en imágenes suelen seguir un modelo codificador-decodificador, con capas convolucionales (Conv) como componentes esenciales. Las capas Conv aplican relleno de ceros en los bordes de los datos de entrada para mantener dimensiones de salida consistentes. Sin embargo, el relleno de ceros introduce artefactos en forma de anillos en los bordes de las imágenes de salida, conocidos como efectos de borde, que afectan negativamente la capacidad de la red para aprender características efectivas. En métodos tradicionales, estos efectos de borde, asociados con operaciones convolucionales/deconvolucionales, se han mitigado utilizando técnicas basadas en parches. Inspirados por esta observación, se exploraron algoritmos de filtrado de ruido por parches para derivar una arquitectura de CNN que evita los efectos de borde. Específicamente, extendemos el autoencoder por parches para aprender mapeos de imágenes a través de operaciones de extracción y promediado de parches, demostrando que el autoencoder por parches es equivalente a una arquitectura específica de red neuronal convolucional (CNN), lo que resulta en un nuevo bloque residual. Este nuevo bloque residual incluye una máscara que mejora la capacidad de la CNN para aprender características de borde y elimina artefactos en los bordes, conocido como el Bloque Residual Mejorado en los Bordes (BERBlock). Apilando BERBlocks, construimos un filtro de ruido U-Net (BERUNet). Experimentos en conjuntos de datos públicos demuestran que el BERUNet propuesto logra un rendimiento excepcional. La arquitectura de red propuesta se basa en derivaciones matemáticas rigurosas, lo que hace que su mecanismo de funcionamiento sea altamente interpretable. El código y todos los modelos preentrenados están disponibles públicamente.
Descripción
Las redes neuronales profundas para el filtrado de ruido en imágenes suelen seguir un modelo codificador-decodificador, con capas convolucionales (Conv) como componentes esenciales. Las capas Conv aplican relleno de ceros en los bordes de los datos de entrada para mantener dimensiones de salida consistentes. Sin embargo, el relleno de ceros introduce artefactos en forma de anillos en los bordes de las imágenes de salida, conocidos como efectos de borde, que afectan negativamente la capacidad de la red para aprender características efectivas. En métodos tradicionales, estos efectos de borde, asociados con operaciones convolucionales/deconvolucionales, se han mitigado utilizando técnicas basadas en parches. Inspirados por esta observación, se exploraron algoritmos de filtrado de ruido por parches para derivar una arquitectura de CNN que evita los efectos de borde. Específicamente, extendemos el autoencoder por parches para aprender mapeos de imágenes a través de operaciones de extracción y promediado de parches, demostrando que el autoencoder por parches es equivalente a una arquitectura específica de red neuronal convolucional (CNN), lo que resulta en un nuevo bloque residual. Este nuevo bloque residual incluye una máscara que mejora la capacidad de la CNN para aprender características de borde y elimina artefactos en los bordes, conocido como el Bloque Residual Mejorado en los Bordes (BERBlock). Apilando BERBlocks, construimos un filtro de ruido U-Net (BERUNet). Experimentos en conjuntos de datos públicos demuestran que el BERUNet propuesto logra un rendimiento excepcional. La arquitectura de red propuesta se basa en derivaciones matemáticas rigurosas, lo que hace que su mecanismo de funcionamiento sea altamente interpretable. El código y todos los modelos preentrenados están disponibles públicamente.