Imagen de segmentación de la imagen de ultrasonido de la vaina del nervio óptico basada en CBC-YOLOv5s
Autores: Chu, Yonghua; Xu, Jinyang; Wu, Chunshuang; Ye, Jianping; Zhang, Jucheng; Shen, Lei; Wang, Huaxia; Yao, Yudong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Imagen de segmentación de la imagen de ultrasonido de la vaina del nervio óptico basada en CBC-YOLOv5s
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Diámetro de la vaina del nervio óptico
Métodos no invasivos
Aprendizaje profundo
Imágenes de ultrasonido
CBC-YOLOv5s
Características globales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
El diámetro de la vaina del nervio óptico es un indicador importante para evaluar la presión intracraneal en pacientes críticamente enfermos. Los métodos para medir el diámetro de la vaina del nervio óptico generalmente se dividen en métodos invasivos y no invasivos. En comparación con los métodos invasivos, los métodos no invasivos son más seguros y, por lo tanto, han ganado popularidad. Entre los métodos no invasivos, el uso del aprendizaje profundo para procesar las imágenes de ultrasonido de los ojos de pacientes críticamente enfermos y generar rápidamente el diámetro de la vaina del nervio óptico ofrece ventajas significativas. Este documento propone un método de segmentación de imágenes de ultrasonido de la vaina del nervio óptico CBC-YOLOv5s que integra características locales y globales. Primero, introduce la red de extracción de características de Backbone CBC, que consiste en módulos C3 Swin-Transformer de doble capa (C3STR) y módulos Bottleneck Transformer de doble capa (BoT3). La red de base C3STR se enfoca en las características locales de la vaina del nervio óptico con conexiones residuales y convoluciones de múltiples capas, mientras que el mecanismo de Atención de Transformador de Ventana (WTA) en el módulo C3STR y la Autoatención de Múltiples Cabezas (MHSA) en el módulo BoT3 mejoran la comprensión del modelo de las características globales de la vaina del nervio óptico. Las características locales y globales extraídas se integran completamente en el módulo de Fusión de Pirámide Espacial (SPPF). Además, se propone la pirámide de características CBC-Neck, que incluye un módulo C3STR de una sola capa y un módulo CReToNeXt (CRTN) de tres capas. Durante la fusión de características de upsampling, el módulo C3STR se utiliza para mejorar la conciencia local y global de las características fusionadas. Durante la fusión de características de downsampling, el diseño residual de varios niveles del módulo CRTN ayuda a la red a capturar mejor las características globales de la vaina del nervio óptico dentro de las características fusionadas. La introducción de estos módulos logra la integración completa de las características locales y globales, lo que permite al modelo identificar de manera eficiente y precisa los límites de la vaina del nervio óptico, incluso cuando las imágenes de ultrasonido ocular son borrosas o los límites no están claros. El conjunto de datos Z2HOSPITAL-5000 recopilado del Segundo Hospital de la Universidad de Zhejiang se utilizó para los experimentos. En comparación con los ampliamente utilizados algoritmos YOLOv5s y U-Net, el método propuesto muestra un rendimiento mejorado en el conjunto de pruebas borroso. Específicamente, el método propuesto logra valores de precisión, recall e Intersección sobre Unión (IoU) que son 4.1%, 2.1% y 4.5% más altos que los de YOLOv5s. En comparación con U-Net, la precisión, el recall y el IoU mejoran en un 9.2%, 21% y 19.7%, respectivamente.
Descripción
El diámetro de la vaina del nervio óptico es un indicador importante para evaluar la presión intracraneal en pacientes críticamente enfermos. Los métodos para medir el diámetro de la vaina del nervio óptico generalmente se dividen en métodos invasivos y no invasivos. En comparación con los métodos invasivos, los métodos no invasivos son más seguros y, por lo tanto, han ganado popularidad. Entre los métodos no invasivos, el uso del aprendizaje profundo para procesar las imágenes de ultrasonido de los ojos de pacientes críticamente enfermos y generar rápidamente el diámetro de la vaina del nervio óptico ofrece ventajas significativas. Este documento propone un método de segmentación de imágenes de ultrasonido de la vaina del nervio óptico CBC-YOLOv5s que integra características locales y globales. Primero, introduce la red de extracción de características de Backbone CBC, que consiste en módulos C3 Swin-Transformer de doble capa (C3STR) y módulos Bottleneck Transformer de doble capa (BoT3). La red de base C3STR se enfoca en las características locales de la vaina del nervio óptico con conexiones residuales y convoluciones de múltiples capas, mientras que el mecanismo de Atención de Transformador de Ventana (WTA) en el módulo C3STR y la Autoatención de Múltiples Cabezas (MHSA) en el módulo BoT3 mejoran la comprensión del modelo de las características globales de la vaina del nervio óptico. Las características locales y globales extraídas se integran completamente en el módulo de Fusión de Pirámide Espacial (SPPF). Además, se propone la pirámide de características CBC-Neck, que incluye un módulo C3STR de una sola capa y un módulo CReToNeXt (CRTN) de tres capas. Durante la fusión de características de upsampling, el módulo C3STR se utiliza para mejorar la conciencia local y global de las características fusionadas. Durante la fusión de características de downsampling, el diseño residual de varios niveles del módulo CRTN ayuda a la red a capturar mejor las características globales de la vaina del nervio óptico dentro de las características fusionadas. La introducción de estos módulos logra la integración completa de las características locales y globales, lo que permite al modelo identificar de manera eficiente y precisa los límites de la vaina del nervio óptico, incluso cuando las imágenes de ultrasonido ocular son borrosas o los límites no están claros. El conjunto de datos Z2HOSPITAL-5000 recopilado del Segundo Hospital de la Universidad de Zhejiang se utilizó para los experimentos. En comparación con los ampliamente utilizados algoritmos YOLOv5s y U-Net, el método propuesto muestra un rendimiento mejorado en el conjunto de pruebas borroso. Específicamente, el método propuesto logra valores de precisión, recall e Intersección sobre Unión (IoU) que son 4.1%, 2.1% y 4.5% más altos que los de YOLOv5s. En comparación con U-Net, la precisión, el recall y el IoU mejoran en un 9.2%, 21% y 19.7%, respectivamente.