NUMSnet: Red de Segmentación Multi-Clase en Forma de U Anidada para Pilas de Imágenes Médicas 3D
Autores: Roychowdhury, Sohini
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
NUMSnet: Red de Segmentación Multi-Clase en Forma de U Anidada para Pilas de Imágenes Médicas 3D
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Segmentación semántica
Modelo NUMSnet
Modelo Unet
Multi-clase
Pilas de imágenes volumétricas
Rendimiento de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La segmentación semántica de pilas de imágenes médicas en 3D permite reconstrucciones volumétricas precisas, diagnósticos asistidos por computadora y planificación de tratamientos de seguimiento. En este trabajo, presentamos una nueva variante del modelo Unet, llamada NUMSnet, que transmite características de vecindario de píxeles a través de escaneos mediante capas anidadas para lograr una segmentación semántica multiclasificada precisa con datos de entrenamiento mínimos. Analizamos el rendimiento de la segmentación semántica del modelo NUMSnet en comparación con varias variantes del modelo Unet en la segmentación de 3-7 regiones de interés utilizando solo el 5-10% de las imágenes para el entrenamiento por pila de imágenes volumétricas de Lung-CT y Heart-CT. El modelo NUMSnet propuesto logra hasta un 20% de mejora en la recuperación de segmentación, con un 2-9% de mejora en las puntuaciones de Dice para las pilas de Lung-CT y un 2.5-16% de mejora en las puntuaciones de Dice para las pilas de Heart-CT en comparación con el modelo Unet++. El modelo NUMSnet necesita ser entrenado con imágenes ordenadas alrededor del escaneo central de cada pila volumétrica. La propagación de la información de características de imagen desde las seis capas anidadas del modelo Unet++ se ha encontrado que tiene un mejor rendimiento de cálculo y segmentación que la propagación de menos capas ocultas o de las diez capas de aumento en un modelo Unet++. El modelo NUMSnet logra un rendimiento de segmentación comparable a trabajos anteriores mientras se entrena con tan solo el 5-10% de las imágenes de las pilas 3D. Además, el aprendizaje por transferencia permite una convergencia más rápida del modelo NUMSnet para la segmentación semántica multiclasificada de patologías en imágenes de Lung-CT a la segmentación cardíaca en pilas de Heart-CT. Así, el modelo propuesto puede estandarizar la segmentación semántica multiclasificada para una variedad de pilas de imágenes volumétricas con un conjunto de datos de entrenamiento mínimo. Esto puede reducir significativamente el costo, el tiempo y la variabilidad entre observadores asociados con la detección y tratamiento asistidos por computadora.
Descripción
La segmentación semántica de pilas de imágenes médicas en 3D permite reconstrucciones volumétricas precisas, diagnósticos asistidos por computadora y planificación de tratamientos de seguimiento. En este trabajo, presentamos una nueva variante del modelo Unet, llamada NUMSnet, que transmite características de vecindario de píxeles a través de escaneos mediante capas anidadas para lograr una segmentación semántica multiclasificada precisa con datos de entrenamiento mínimos. Analizamos el rendimiento de la segmentación semántica del modelo NUMSnet en comparación con varias variantes del modelo Unet en la segmentación de 3-7 regiones de interés utilizando solo el 5-10% de las imágenes para el entrenamiento por pila de imágenes volumétricas de Lung-CT y Heart-CT. El modelo NUMSnet propuesto logra hasta un 20% de mejora en la recuperación de segmentación, con un 2-9% de mejora en las puntuaciones de Dice para las pilas de Lung-CT y un 2.5-16% de mejora en las puntuaciones de Dice para las pilas de Heart-CT en comparación con el modelo Unet++. El modelo NUMSnet necesita ser entrenado con imágenes ordenadas alrededor del escaneo central de cada pila volumétrica. La propagación de la información de características de imagen desde las seis capas anidadas del modelo Unet++ se ha encontrado que tiene un mejor rendimiento de cálculo y segmentación que la propagación de menos capas ocultas o de las diez capas de aumento en un modelo Unet++. El modelo NUMSnet logra un rendimiento de segmentación comparable a trabajos anteriores mientras se entrena con tan solo el 5-10% de las imágenes de las pilas 3D. Además, el aprendizaje por transferencia permite una convergencia más rápida del modelo NUMSnet para la segmentación semántica multiclasificada de patologías en imágenes de Lung-CT a la segmentación cardíaca en pilas de Heart-CT. Así, el modelo propuesto puede estandarizar la segmentación semántica multiclasificada para una variedad de pilas de imágenes volumétricas con un conjunto de datos de entrenamiento mínimo. Esto puede reducir significativamente el costo, el tiempo y la variabilidad entre observadores asociados con la detección y tratamiento asistidos por computadora.