Un modelo eficiente de red neuronal convolucional combinado con mecanismo de atención para la inversión de semitonos
Autores: Shao, Linhao; Zhang, Erhu; Li, Mei
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un modelo eficiente de red neuronal convolucional combinado con mecanismo de atención para la inversión de semitonos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Restauración de imágenes
Mecanismo de atención
Modelo de aprendizaje profundo
Inversión de semitonos
Extracción de características
Restauración de texturas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
La inversión de semitonos, actuando como un problema especial de restauración de imágenes, es un problema mal planteado. Aunque ha sido estudiado en las últimas décadas, las soluciones existentes no pueden restaurar detalles finos y texturas de manera precisa a partir de imágenes de semitonos. Recientemente, el mecanismo de atención ha mostrado sus efectos poderosos en muchos campos, como el procesamiento de imágenes, el reconocimiento de patrones y la visión por computadora. Sin embargo, aún no se ha utilizado en la inversión de semitonos. Para resolver mejor el problema de restauración de detalles de la inversión de semitonos, este documento propone un modelo de aprendizaje profundo simple pero efectivo combinado con el mecanismo de atención, que puede guiar mejor a la red para eliminar patrones de puntos de ruido y restaurar detalles de la imagen, y mejorar la capacidad de adaptación de la red. El modelo completo está diseñado de manera integral, incluyendo la etapa de extracción de características y la etapa de reconstrucción. En la etapa de extracción de características, se extraen las características de la imagen de semitonos y se eliminan los ruidos de semitonos. La etapa de reconstrucción se emplea para restaurar imágenes de tono continuo fusionando la información de características extraída en la primera etapa y la salida del bloque de atención del canal residual. En esta etapa, el bloque de atención se introduce por primera vez en el campo de la inversión de semitonos, lo que puede hacer que la red se enfoque en características informativas y mejore aún más la capacidad discriminativa de la red. Además, se propone una función de pérdida multi-etapa para acelerar la optimización de la red, lo que es beneficioso para una mejor reconstrucción de la imagen global. Para demostrar el rendimiento de generalización de la red para diferentes tipos de imágenes de semitonos, los resultados experimentales confirman que la red puede restaurar seis tipos diferentes de imágenes de semitonos correctamente. Además, los resultados experimentales muestran que nuestro método supera a los métodos más avanzados, especialmente en la restauración de detalles y texturas.
Descripción
La inversión de semitonos, actuando como un problema especial de restauración de imágenes, es un problema mal planteado. Aunque ha sido estudiado en las últimas décadas, las soluciones existentes no pueden restaurar detalles finos y texturas de manera precisa a partir de imágenes de semitonos. Recientemente, el mecanismo de atención ha mostrado sus efectos poderosos en muchos campos, como el procesamiento de imágenes, el reconocimiento de patrones y la visión por computadora. Sin embargo, aún no se ha utilizado en la inversión de semitonos. Para resolver mejor el problema de restauración de detalles de la inversión de semitonos, este documento propone un modelo de aprendizaje profundo simple pero efectivo combinado con el mecanismo de atención, que puede guiar mejor a la red para eliminar patrones de puntos de ruido y restaurar detalles de la imagen, y mejorar la capacidad de adaptación de la red. El modelo completo está diseñado de manera integral, incluyendo la etapa de extracción de características y la etapa de reconstrucción. En la etapa de extracción de características, se extraen las características de la imagen de semitonos y se eliminan los ruidos de semitonos. La etapa de reconstrucción se emplea para restaurar imágenes de tono continuo fusionando la información de características extraída en la primera etapa y la salida del bloque de atención del canal residual. En esta etapa, el bloque de atención se introduce por primera vez en el campo de la inversión de semitonos, lo que puede hacer que la red se enfoque en características informativas y mejore aún más la capacidad discriminativa de la red. Además, se propone una función de pérdida multi-etapa para acelerar la optimización de la red, lo que es beneficioso para una mejor reconstrucción de la imagen global. Para demostrar el rendimiento de generalización de la red para diferentes tipos de imágenes de semitonos, los resultados experimentales confirman que la red puede restaurar seis tipos diferentes de imágenes de semitonos correctamente. Además, los resultados experimentales muestran que nuestro método supera a los métodos más avanzados, especialmente en la restauración de detalles y texturas.