G2d-net: eficiente deshacer con unidades de compuerta de segundo orden
Autores: Jia, Jia; Wang, Zhibo; Min, Jeongik
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
G2d-net: eficiente deshacer con unidades de compuerta de segundo orden
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Imagen desempañada
Aprendizaje profundo
Redes neuronales convolucionales
G2D-Net
Transformadores de Visión
Bloque FFT-g2D
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
La imagen de desempañado tiene como objetivo reconstruir imágenes potencialmente claras a partir de imágenes correspondientes corrompidas por la niebla. Con el rápido desarrollo de las tecnologías relacionadas con el aprendizaje profundo, los métodos de desempañado basados en redes neuronales convolucionales profundas se han convertido gradualmente en la corriente principal. Notamos que los métodos de desempañado existentes a menudo van acompañados de un aumento en la carga computacional al tiempo que mejoran el rendimiento del desempañado. Proponemos una nueva red neuronal de desempañado ligera para equilibrar el rendimiento y la eficiencia: el g2D-Net. El g2D-Net toma prestadas las ideas de diseño de adaptación de entrada e interacción de información a largo plazo de los Transformadores de Visión e introduce dos tipos de bloques convolucionales, es decir, el Bloque g2D y el Bloque FFT-g2D. Específicamente, el Bloque g2D es un bloque residual con unidades de compuerta de segundo orden, que heredan la propiedad de adaptación de entrada de una unidad de compuerta y pueden realizar la interacción de segundo orden de la información espacial. El Bloque FFT-g2D es una variante del Bloque g2D, que extrae eficientemente las características globales de los mapas de características a través de la convolución rápida de Fourier y las fusiona con características locales. Además, empleamos la capa de fusión SK Fusion para mejorar la capa de fusión en cascada en un U-Net tradicional, introduciendo así el mecanismo de atención de canal y fusionando dinámicamente información de diferentes caminos. Realizamos experimentos comparativos en cinco conjuntos de datos de referencia, y los resultados demuestran que el g2D-Net logra un impresionante rendimiento de desempañado con una complejidad relativamente baja.
Descripción
La imagen de desempañado tiene como objetivo reconstruir imágenes potencialmente claras a partir de imágenes correspondientes corrompidas por la niebla. Con el rápido desarrollo de las tecnologías relacionadas con el aprendizaje profundo, los métodos de desempañado basados en redes neuronales convolucionales profundas se han convertido gradualmente en la corriente principal. Notamos que los métodos de desempañado existentes a menudo van acompañados de un aumento en la carga computacional al tiempo que mejoran el rendimiento del desempañado. Proponemos una nueva red neuronal de desempañado ligera para equilibrar el rendimiento y la eficiencia: el g2D-Net. El g2D-Net toma prestadas las ideas de diseño de adaptación de entrada e interacción de información a largo plazo de los Transformadores de Visión e introduce dos tipos de bloques convolucionales, es decir, el Bloque g2D y el Bloque FFT-g2D. Específicamente, el Bloque g2D es un bloque residual con unidades de compuerta de segundo orden, que heredan la propiedad de adaptación de entrada de una unidad de compuerta y pueden realizar la interacción de segundo orden de la información espacial. El Bloque FFT-g2D es una variante del Bloque g2D, que extrae eficientemente las características globales de los mapas de características a través de la convolución rápida de Fourier y las fusiona con características locales. Además, empleamos la capa de fusión SK Fusion para mejorar la capa de fusión en cascada en un U-Net tradicional, introduciendo así el mecanismo de atención de canal y fusionando dinámicamente información de diferentes caminos. Realizamos experimentos comparativos en cinco conjuntos de datos de referencia, y los resultados demuestran que el g2D-Net logra un impresionante rendimiento de desempañado con una complejidad relativamente baja.