Sintetizando imágenes ponderadas en difusión de alto valor b de cáncer gástrico utilizando un mejor ciclo GAN de transformador de visión
Autores: Hu, Can; Bian, Congchao; Cao, Ning; Zhou, Han; Guo, Bin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Sintetizando imágenes ponderadas en difusión de alto valor b de cáncer gástrico utilizando un mejor ciclo GAN de transformador de visión
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Imagen ponderada en difusión
Cáncer gástrico
Marco ADCVCGAN
Calidad de imagen
Tiempo de escaneo
DWI sintético
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Antecedentes: La técnica de imagen por resonancia magnética con difusión (DWI), un componente fundamental de la imagen por resonancia magnética multiparamétrica (mpMRI), desempeña un papel crucial en la detección, diagnóstico y evaluación del cáncer gástrico. A pesar de su potencial, la DWI suele estar afectada por distorsiones anatómicas sustanciales y artefactos de sensibilidad, lo que puede obstaculizar su utilidad práctica. Actualmente, mejorar la calidad de imagen de la DWI requiere depender de hardware de vanguardia y de duraciones de escaneo prolongadas. El desarrollo de una técnica rápida que equilibre de manera óptima el tiempo de adquisición reducido con una mejor calidad de imagen tendría una relevancia clínica sustancial. Objetivos: Este estudio tiene como objetivo construir y evaluar el marco de aprendizaje no supervisado llamado atención dual transformer ciclogan de visión de contraste (ADCVCGAN) para mejorar la calidad de imagen y reducir el tiempo de escaneo en la DWI gástrica. Métodos: El marco ADCVCGAN, propuesto en este estudio, emplea la DWI de alto valor b (b = 1200) como referencia para generar DWI de valor b sintético (s-DWI) a partir de la DWI de valor b más bajo adquirida (a-DWI, b = 800). Específicamente, ADCVCGAN incorpora un módulo CBAM de mecanismo de atención en el generador CycleGAN para mejorar la extracción de características de la a-DWI de entrada tanto en los canales como en las dimensiones espaciales. Posteriormente, se introduce un módulo de transformador de visión, basado en el marco U-net, para refinar características detalladas, con el objetivo de producir s-DWI con una calidad de imagen comparable a la de b-DWI. Finalmente, las imágenes del dominio fuente se añaden como muestras negativas al discriminador, lo que anima al discriminador a dirigir al generador hacia la síntesis de imágenes distantes del dominio fuente en el espacio latente, con el objetivo de generar s-DWI más realistas. La calidad de imagen de la s-DWI se evalúa cuantitativamente utilizando métricas como la relación pico-señal a ruido (PSNR), el índice de similitud estructural (SSIM), el índice de similitud de características (FSIM), el error cuadrático medio (MSE), la relación pico-señal a ruido ponderada (WPSNR) y el error cuadrático medio ponderado (WMSE). Se realizaron evaluaciones subjetivas de diferentes imágenes de DWI utilizando la prueba de rangos con signo de Wilcoxon. La reproducibilidad y consistencia de las lecturas de b-ADC y s-ADC, calculadas a partir de b-DWI y s-DWI, respectivamente, se evaluaron utilizando el coeficiente de correlación intraclase (ICC). Se consideró un nivel de significancia estadística de < 0,05. Resultados: La s-DWI generada por el marco de aprendizaje no supervisado ADCVCGAN obtuvo puntuaciones significativamente más altas que la a-DWI en métricas cuantitativas como PSNR, SSIM, FSIM, MSE, WPSNR y WMSE, con significancia estadística (< 0,001). Este rendimiento es comparable al nivel óptimo logrado por los últimos algoritmos sintéticos. Las puntuaciones subjetivas para la visibilidad de lesiones, los detalles anatómicos de la imagen, la distorsión de la imagen y la calidad general de la imagen fueron significativamente más altas para s-DWI y b-DWI en comparación con a-DWI (< 0,001). Al mismo tiempo, no hubo diferencias significativas entre las puntuaciones de s-DWI y b-DWI (> 0,05). La consistencia de las lecturas de b-ADC y s-ADC fue comparable entre diferentes lectores (ICC: b-ADC 0,87-0,90; s-ADC 0,88-0,89, respectivamente). La repetibilidad de las lecturas de b-ADC y s-ADC por el mismo lector también fue comparable (ICC Lector1: b-ADC 0,85-0,86, s-ADC 0,85-0,93; ICC Lector2: b
Descripción
Antecedentes: La técnica de imagen por resonancia magnética con difusión (DWI), un componente fundamental de la imagen por resonancia magnética multiparamétrica (mpMRI), desempeña un papel crucial en la detección, diagnóstico y evaluación del cáncer gástrico. A pesar de su potencial, la DWI suele estar afectada por distorsiones anatómicas sustanciales y artefactos de sensibilidad, lo que puede obstaculizar su utilidad práctica. Actualmente, mejorar la calidad de imagen de la DWI requiere depender de hardware de vanguardia y de duraciones de escaneo prolongadas. El desarrollo de una técnica rápida que equilibre de manera óptima el tiempo de adquisición reducido con una mejor calidad de imagen tendría una relevancia clínica sustancial. Objetivos: Este estudio tiene como objetivo construir y evaluar el marco de aprendizaje no supervisado llamado atención dual transformer ciclogan de visión de contraste (ADCVCGAN) para mejorar la calidad de imagen y reducir el tiempo de escaneo en la DWI gástrica. Métodos: El marco ADCVCGAN, propuesto en este estudio, emplea la DWI de alto valor b (b = 1200) como referencia para generar DWI de valor b sintético (s-DWI) a partir de la DWI de valor b más bajo adquirida (a-DWI, b = 800). Específicamente, ADCVCGAN incorpora un módulo CBAM de mecanismo de atención en el generador CycleGAN para mejorar la extracción de características de la a-DWI de entrada tanto en los canales como en las dimensiones espaciales. Posteriormente, se introduce un módulo de transformador de visión, basado en el marco U-net, para refinar características detalladas, con el objetivo de producir s-DWI con una calidad de imagen comparable a la de b-DWI. Finalmente, las imágenes del dominio fuente se añaden como muestras negativas al discriminador, lo que anima al discriminador a dirigir al generador hacia la síntesis de imágenes distantes del dominio fuente en el espacio latente, con el objetivo de generar s-DWI más realistas. La calidad de imagen de la s-DWI se evalúa cuantitativamente utilizando métricas como la relación pico-señal a ruido (PSNR), el índice de similitud estructural (SSIM), el índice de similitud de características (FSIM), el error cuadrático medio (MSE), la relación pico-señal a ruido ponderada (WPSNR) y el error cuadrático medio ponderado (WMSE). Se realizaron evaluaciones subjetivas de diferentes imágenes de DWI utilizando la prueba de rangos con signo de Wilcoxon. La reproducibilidad y consistencia de las lecturas de b-ADC y s-ADC, calculadas a partir de b-DWI y s-DWI, respectivamente, se evaluaron utilizando el coeficiente de correlación intraclase (ICC). Se consideró un nivel de significancia estadística de < 0,05. Resultados: La s-DWI generada por el marco de aprendizaje no supervisado ADCVCGAN obtuvo puntuaciones significativamente más altas que la a-DWI en métricas cuantitativas como PSNR, SSIM, FSIM, MSE, WPSNR y WMSE, con significancia estadística (< 0,001). Este rendimiento es comparable al nivel óptimo logrado por los últimos algoritmos sintéticos. Las puntuaciones subjetivas para la visibilidad de lesiones, los detalles anatómicos de la imagen, la distorsión de la imagen y la calidad general de la imagen fueron significativamente más altas para s-DWI y b-DWI en comparación con a-DWI (< 0,001). Al mismo tiempo, no hubo diferencias significativas entre las puntuaciones de s-DWI y b-DWI (> 0,05). La consistencia de las lecturas de b-ADC y s-ADC fue comparable entre diferentes lectores (ICC: b-ADC 0,87-0,90; s-ADC 0,88-0,89, respectivamente). La repetibilidad de las lecturas de b-ADC y s-ADC por el mismo lector también fue comparable (ICC Lector1: b-ADC 0,85-0,86, s-ADC 0,85-0,93; ICC Lector2: b