Un u-net basado en ponderación adaptativa del espacio propio para la segmentación de imágenes
Autores: Cho, Choongsang; Lee, Young Han; Park, Jongyoul; Lee, Sangkeun
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un u-net basado en ponderación adaptativa del espacio propio para la segmentación de imágenes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Segmentación de imágenes
Médico
Arquitectura codificador-decodificador
Esquema de ponderación adaptativa espacial
Marco de trabajo ResNet
Bloque convolucional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La segmentación semántica de imágenes tiene una amplia gama de aplicaciones. Cuando se trata de la segmentación de imágenes médicas, su precisión es aún más importante que en otras áreas porque el rendimiento proporciona información útil directamente aplicable al diagnóstico de enfermedades, la planificación quirúrgica y el monitoreo del historial. Los modelos de vanguardia en la segmentación de imágenes médicas son variantes de la arquitectura codificador-decodificador, llamada U-Net. Para reflejar de manera efectiva las características espaciales en los mapas de características en la arquitectura codificador-decodificador, proponemos un esquema de ponderación adaptativa espacial para la segmentación de imágenes médicas. Específicamente, la característica espacial se estima a partir de los mapas de características, y los parámetros de ponderación aprendidos se obtienen a partir del mapa calculado, ya que los resultados de segmentación se predicen a partir del mapa de características a través de una capa convolucional. Especialmente en las redes propuestas, el bloque convolucional para extraer el mapa de características se reemplaza con los marcos convolucionales ampliamente utilizados: VGG, ResNet y estructuras de ResNet de cuello de botella. Además, un método de aumento bilineal reemplaza la capa de convolución ascendente para aumentar la resolución del mapa de características. Para la evaluación del rendimiento de la arquitectura propuesta, utilizamos tres conjuntos de datos que abarcan diferentes modalidades de imágenes médicas. Los resultados experimentales muestran que la red con el bloque de ponderación adaptativa espacial propuesto basado en el marco de ResNet obtuvo los puntajes más altos de IoU y DICE en las tres tareas en comparación con otros métodos. En particular, la red de segmentación que combina el bloque auto-adaptativo espacial propuesto y el marco de ResNet registró un aumento del 3.01% y 2.89% en los puntajes de IoU y DICE, respectivamente, en el conjunto de datos Nerve. Por lo tanto, creemos que el esquema propuesto puede ser una herramienta útil para tareas de segmentación de imágenes basadas en la arquitectura codificador-decodificador.
Descripción
La segmentación semántica de imágenes tiene una amplia gama de aplicaciones. Cuando se trata de la segmentación de imágenes médicas, su precisión es aún más importante que en otras áreas porque el rendimiento proporciona información útil directamente aplicable al diagnóstico de enfermedades, la planificación quirúrgica y el monitoreo del historial. Los modelos de vanguardia en la segmentación de imágenes médicas son variantes de la arquitectura codificador-decodificador, llamada U-Net. Para reflejar de manera efectiva las características espaciales en los mapas de características en la arquitectura codificador-decodificador, proponemos un esquema de ponderación adaptativa espacial para la segmentación de imágenes médicas. Específicamente, la característica espacial se estima a partir de los mapas de características, y los parámetros de ponderación aprendidos se obtienen a partir del mapa calculado, ya que los resultados de segmentación se predicen a partir del mapa de características a través de una capa convolucional. Especialmente en las redes propuestas, el bloque convolucional para extraer el mapa de características se reemplaza con los marcos convolucionales ampliamente utilizados: VGG, ResNet y estructuras de ResNet de cuello de botella. Además, un método de aumento bilineal reemplaza la capa de convolución ascendente para aumentar la resolución del mapa de características. Para la evaluación del rendimiento de la arquitectura propuesta, utilizamos tres conjuntos de datos que abarcan diferentes modalidades de imágenes médicas. Los resultados experimentales muestran que la red con el bloque de ponderación adaptativa espacial propuesto basado en el marco de ResNet obtuvo los puntajes más altos de IoU y DICE en las tres tareas en comparación con otros métodos. En particular, la red de segmentación que combina el bloque auto-adaptativo espacial propuesto y el marco de ResNet registró un aumento del 3.01% y 2.89% en los puntajes de IoU y DICE, respectivamente, en el conjunto de datos Nerve. Por lo tanto, creemos que el esquema propuesto puede ser una herramienta útil para tareas de segmentación de imágenes basadas en la arquitectura codificador-decodificador.