Comparando modelos basados en U-Net para el filtrado de imágenes a color
Autores: Komatsu, Rina; Gonsalves, Tad
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Comparando modelos basados en U-Net para el filtrado de imágenes a color
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Imágenes digitales
Ruido
Modelo de reducción de ruido
Aprendizaje profundo
Arquitectura U-Net
Ruido gaussiano
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Las imágenes digitales suelen corromperse con ruido no deseado durante el proceso de adquisición, compresión, almacenamiento y transmisión. Aunque los tipos de ruido digital son variados, los estudios actuales de eliminación de ruido se centran en eliminar solo un tipo específico de ruido utilizando un modelo de aprendizaje profundo dedicado. La falta de generalización es una limitación importante de estos modelos. No se pueden extender para filtrar ruidos de imagen distintos a los para los que fueron diseñados. Este estudio trata sobre el diseño y entrenamiento de un modelo de eliminación de ruido de aprendizaje profundo generalizado que puede eliminar cinco tipos diferentes de ruido de cualquier imagen digital: ruido gaussiano, ruido sal y pimienta, blancos recortados, negros recortados y sacudidas de cámara. El modelo de eliminación de ruido se construye sobre la arquitectura estándar de segmentación U-Net y tiene tres variantes: U-Net con Normalización de Grupo, U-Net Residual y U-Net Denso. La combinación de una función de pérdida de norma adversaria y L1 reproduce imágenes con ruido eliminado de forma nítida y muestra una mejora en el rendimiento en comparación con el U-Net estándar, la Red Neuronal Convolucional de Eliminación de Ruido (DnCNN) y los modelos de eliminación de ruido de Red de Interfaz Ancha (WIN5RB).
Descripción
Las imágenes digitales suelen corromperse con ruido no deseado durante el proceso de adquisición, compresión, almacenamiento y transmisión. Aunque los tipos de ruido digital son variados, los estudios actuales de eliminación de ruido se centran en eliminar solo un tipo específico de ruido utilizando un modelo de aprendizaje profundo dedicado. La falta de generalización es una limitación importante de estos modelos. No se pueden extender para filtrar ruidos de imagen distintos a los para los que fueron diseñados. Este estudio trata sobre el diseño y entrenamiento de un modelo de eliminación de ruido de aprendizaje profundo generalizado que puede eliminar cinco tipos diferentes de ruido de cualquier imagen digital: ruido gaussiano, ruido sal y pimienta, blancos recortados, negros recortados y sacudidas de cámara. El modelo de eliminación de ruido se construye sobre la arquitectura estándar de segmentación U-Net y tiene tres variantes: U-Net con Normalización de Grupo, U-Net Residual y U-Net Denso. La combinación de una función de pérdida de norma adversaria y L1 reproduce imágenes con ruido eliminado de forma nítida y muestra una mejora en el rendimiento en comparación con el U-Net estándar, la Red Neuronal Convolucional de Eliminación de Ruido (DnCNN) y los modelos de eliminación de ruido de Red de Interfaz Ancha (WIN5RB).