Método de mejora de imagen no supervisado basado en la guía de red de mapas de atención y mecanismo de atención
Autores: Wu, Mengfei; Lan, Taiji; Xue, Xucheng; Xu, Xinwei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Método de mejora de imagen no supervisado basado en la guía de red de mapas de atención y mecanismo de atención
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Mejora de imagen con poca luz
Técnicas de aprendizaje profundo
Mejora de imagen no supervisada
LSGAN
Red de mapa de atención
Rendimiento de mejora
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 52
Citaciones: Sin citaciones
La mejora de imágenes con poca luz es una tarea de preprocesamiento crucial en tareas de visión complejas. Afecta directamente a la detección de objetos, la segmentación de imágenes y los resultados del reconocimiento de imágenes. En los últimos años, con el continuo desarrollo de técnicas de aprendizaje profundo, han surgido un número creciente de métodos de mejora de imágenes basados en aprendizaje profundo. Sin embargo, debido al alto costo de la recopilación de datos y al contenido limitado de conjuntos de datos de aprendizaje supervisado, cada vez más académicos han trasladado su enfoque al campo de la mejora de imágenes no supervisada. Los métodos de mejora de imágenes no supervisados no requieren imágenes emparejadas de la misma escena durante el proceso de entrenamiento, lo que reduce considerablemente el umbral para el entrenamiento de la red. No obstante, los métodos no supervisados actuales aún sufren problemas como efectos de mejora inestables y capacidad de generalización limitada. Para abordar estos problemas, proponemos un método mejorado de mejora de imágenes con poca luz. El método propuesto emplea el LSGAN como arquitectura de entrenamiento y utiliza una red de mapas de atención para generar dinámicamente mapas de atención que se ajusten mejor a la tarea de mejora de la red, lo que puede mejorar efectivamente la capacidad de generalización y el rendimiento de mejora de la red. Además, adoptamos un mecanismo de atención para mejorar los detalles sutiles de las características de la imagen. En cuanto al entrenamiento de la red, considerando que el discriminador tradicional de la red neuronal convolucional puede no proporcionar una guía efectiva al generador en las primeras etapas de entrenamiento, proponemos una estructura de discriminador mejorada. Los resultados experimentales demuestran que nuestro método puede lograr un buen rendimiento de mejora en diferentes conjuntos de datos y tiene un valor práctico. Aunque nuestro método tiene ventajas en la mejora de imágenes con poca luz, también tiene ciertas limitaciones, como que el tamaño de la red no cumple con los requisitos de modelos ligeros y el potencial para una mejora adicional en condiciones de luz extremadamente baja. Nos esforzaremos por abordar estos problemas de la manera más completa posible en nuestra investigación futura.
Descripción
La mejora de imágenes con poca luz es una tarea de preprocesamiento crucial en tareas de visión complejas. Afecta directamente a la detección de objetos, la segmentación de imágenes y los resultados del reconocimiento de imágenes. En los últimos años, con el continuo desarrollo de técnicas de aprendizaje profundo, han surgido un número creciente de métodos de mejora de imágenes basados en aprendizaje profundo. Sin embargo, debido al alto costo de la recopilación de datos y al contenido limitado de conjuntos de datos de aprendizaje supervisado, cada vez más académicos han trasladado su enfoque al campo de la mejora de imágenes no supervisada. Los métodos de mejora de imágenes no supervisados no requieren imágenes emparejadas de la misma escena durante el proceso de entrenamiento, lo que reduce considerablemente el umbral para el entrenamiento de la red. No obstante, los métodos no supervisados actuales aún sufren problemas como efectos de mejora inestables y capacidad de generalización limitada. Para abordar estos problemas, proponemos un método mejorado de mejora de imágenes con poca luz. El método propuesto emplea el LSGAN como arquitectura de entrenamiento y utiliza una red de mapas de atención para generar dinámicamente mapas de atención que se ajusten mejor a la tarea de mejora de la red, lo que puede mejorar efectivamente la capacidad de generalización y el rendimiento de mejora de la red. Además, adoptamos un mecanismo de atención para mejorar los detalles sutiles de las características de la imagen. En cuanto al entrenamiento de la red, considerando que el discriminador tradicional de la red neuronal convolucional puede no proporcionar una guía efectiva al generador en las primeras etapas de entrenamiento, proponemos una estructura de discriminador mejorada. Los resultados experimentales demuestran que nuestro método puede lograr un buen rendimiento de mejora en diferentes conjuntos de datos y tiene un valor práctico. Aunque nuestro método tiene ventajas en la mejora de imágenes con poca luz, también tiene ciertas limitaciones, como que el tamaño de la red no cumple con los requisitos de modelos ligeros y el potencial para una mejora adicional en condiciones de luz extremadamente baja. Nos esforzaremos por abordar estos problemas de la manera más completa posible en nuestra investigación futura.