Predicción de U-Net de fusión cruzada a múltiples escalas con convoluciones de wavelet combinadas para la segmentación de nódulos tiroideos
Autores: Liu, Shengzhi; Tang, Haotian; Zhao, Junhao; Liu, Rundong; Zheng, Sirui; Hou, Kaiyao; Zhang, Xiyu; Liu, Fuyong; Ding, Chen
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Predicción de U-Net de fusión cruzada a múltiples escalas con convoluciones de wavelet combinadas para la segmentación de nódulos tiroideos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Nódulos tiroideos
Imágenes de ultrasonido
Métodos de aprendizaje profundo
Fusión multiescala a nivel cruzado U-net
Convoluciones wavelet
Límites de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La segmentación precisa de nódulos tiroideos en imágenes de ultrasonido es esencial para el diagnóstico y tratamiento asistido por computadora. Aunque se han propuesto varios métodos de aprendizaje profundo, distribuciones de intensidad similares y morfología variable de los nódulos a menudo conducen a límites de segmentación borrosos y a la detección fallida de nódulos pequeños. Para abordar este problema, proponemos una U-net de fusión cruzada a múltiples escalas con convoluciones de wavelet combinadas (MCFU-net) para la segmentación de nódulos tiroideos. En primer lugar, la red diseña un bloque de convolución de wavelet de múltiples ramas (MBWC), que desacopla características de textura a través de un análisis multiresolución en el dominio de wavelet y reorganiza características de canal cruzado, mejorando así las capacidades de extracción y agregación de contexto durante la etapa de codificación. En segundo lugar, se construye un módulo de pirámide atrous selectiva por escala (SSAP) basado en percepción dinámica de múltiples niveles para lograr una mejora de saliencia para nódulos de diferentes tamaños, con el fin de mejorar la capacidad de detección de nódulos pequeños. En tercer lugar, para disminuir la pérdida de información de alta resolución durante el aumento de tamaño, se diseña un módulo de fusión cruzada a niveles (CLFM) con mecanismos de refinamiento jerárquico, que reconstruye progresivamente áreas de límites ambiguos a través de un aumento de tamaño multietapa. Los experimentos realizados en dos conjuntos de datos públicos de ultrasonido, TN3K y DDTI, demuestran la efectividad y superioridad de nuestro método, logrando coeficientes de Dice del 85.22% y 78.21% y valores de IoU del 74.25% y 64.23%, respectivamente.
Descripción
La segmentación precisa de nódulos tiroideos en imágenes de ultrasonido es esencial para el diagnóstico y tratamiento asistido por computadora. Aunque se han propuesto varios métodos de aprendizaje profundo, distribuciones de intensidad similares y morfología variable de los nódulos a menudo conducen a límites de segmentación borrosos y a la detección fallida de nódulos pequeños. Para abordar este problema, proponemos una U-net de fusión cruzada a múltiples escalas con convoluciones de wavelet combinadas (MCFU-net) para la segmentación de nódulos tiroideos. En primer lugar, la red diseña un bloque de convolución de wavelet de múltiples ramas (MBWC), que desacopla características de textura a través de un análisis multiresolución en el dominio de wavelet y reorganiza características de canal cruzado, mejorando así las capacidades de extracción y agregación de contexto durante la etapa de codificación. En segundo lugar, se construye un módulo de pirámide atrous selectiva por escala (SSAP) basado en percepción dinámica de múltiples niveles para lograr una mejora de saliencia para nódulos de diferentes tamaños, con el fin de mejorar la capacidad de detección de nódulos pequeños. En tercer lugar, para disminuir la pérdida de información de alta resolución durante el aumento de tamaño, se diseña un módulo de fusión cruzada a niveles (CLFM) con mecanismos de refinamiento jerárquico, que reconstruye progresivamente áreas de límites ambiguos a través de un aumento de tamaño multietapa. Los experimentos realizados en dos conjuntos de datos públicos de ultrasonido, TN3K y DDTI, demuestran la efectividad y superioridad de nuestro método, logrando coeficientes de Dice del 85.22% y 78.21% y valores de IoU del 74.25% y 64.23%, respectivamente.