Pixel diffuser: segmentación interactiva práctica de imágenes médicas sin verdad de referencia
Autores: Ju, Mingeon; Yang, Jaewoo; Lee, Jaeyoung; Lee, Moonhyun; Ji, Junyung; Kim, Younghoon
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Pixel diffuser: segmentación interactiva práctica de imágenes médicas sin verdad de referencia
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Segmentación de imágenes médicas
Métodos de segmentación interactivos
Datos de verdad terreno
PixelDiffuser
Autoencoder basado en VGG19
Región de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La segmentación de imágenes médicas es esencial para que los médicos diagnostiquen enfermedades y gestionen el estado de los pacientes. Aunque el aprendizaje profundo ha demostrado potencial para abordar los desafíos de segmentación dentro del ámbito médico, obtener una cantidad sustancial de datos con una verdad terreno precisa para entrenar modelos de segmentación de alto rendimiento es tanto demorado como requiere atención cuidadosa. Aunque los métodos de segmentación interactiva pueden reducir los costos de adquisición de etiquetas de segmentación para entrenar modelos supervisados, a menudo aún necesitan cantidades considerables de datos de verdad terreno. Además, lograr una segmentación precisa durante la fase de refinamiento resulta en interacciones aumentadas. En este trabajo, proponemos un método interactivo de segmentación médica llamado PixelDiffuser que no requiere datos de verdad terreno de segmentación médica y solo unos pocos clics para obtener una segmentación de alta calidad utilizando un autoencoder basado en VGG19. Como sugiere el nombre, PixelDiffuser comienza con una pequeña área al hacer clic inicial y detecta gradualmente la región de segmentación objetivo. Específicamente, segmentamos la imagen creando una distorsión en la imagen y repitiéndola durante el proceso de codificación y decodificación de la imagen a través de un autoencoder. En consecuencia, PixelDiffuser permite al usuario hacer clic en una parte del órgano que desean segmentar, lo que permite que la región segmentada se expanda a áreas cercanas con valores de píxeles similares al órgano elegido. Para evaluar el rendimiento de PixelDiffuser, empleamos el puntaje de dice, basado en el número de clics, para comparar la imagen de verdad terreno con el segmento inferido. Para la validación del rendimiento de nuestro método, aprovechamos el conjunto de datos BTCV, que contiene imágenes de tomografía computarizada de varios órganos, y el conjunto de datos CHAOS, que abarca imágenes de tomografía computarizada y resonancia magnética del hígado, riñones y bazo. Nuestro modelo propuesto es una herramienta eficiente y efectiva para la segmentación de imágenes médicas, logrando un rendimiento competitivo en comparación con trabajos anteriores en menos de cinco clics y con un consumo de memoria muy bajo sin necesidad de entrenamiento adicional.
Descripción
La segmentación de imágenes médicas es esencial para que los médicos diagnostiquen enfermedades y gestionen el estado de los pacientes. Aunque el aprendizaje profundo ha demostrado potencial para abordar los desafíos de segmentación dentro del ámbito médico, obtener una cantidad sustancial de datos con una verdad terreno precisa para entrenar modelos de segmentación de alto rendimiento es tanto demorado como requiere atención cuidadosa. Aunque los métodos de segmentación interactiva pueden reducir los costos de adquisición de etiquetas de segmentación para entrenar modelos supervisados, a menudo aún necesitan cantidades considerables de datos de verdad terreno. Además, lograr una segmentación precisa durante la fase de refinamiento resulta en interacciones aumentadas. En este trabajo, proponemos un método interactivo de segmentación médica llamado PixelDiffuser que no requiere datos de verdad terreno de segmentación médica y solo unos pocos clics para obtener una segmentación de alta calidad utilizando un autoencoder basado en VGG19. Como sugiere el nombre, PixelDiffuser comienza con una pequeña área al hacer clic inicial y detecta gradualmente la región de segmentación objetivo. Específicamente, segmentamos la imagen creando una distorsión en la imagen y repitiéndola durante el proceso de codificación y decodificación de la imagen a través de un autoencoder. En consecuencia, PixelDiffuser permite al usuario hacer clic en una parte del órgano que desean segmentar, lo que permite que la región segmentada se expanda a áreas cercanas con valores de píxeles similares al órgano elegido. Para evaluar el rendimiento de PixelDiffuser, empleamos el puntaje de dice, basado en el número de clics, para comparar la imagen de verdad terreno con el segmento inferido. Para la validación del rendimiento de nuestro método, aprovechamos el conjunto de datos BTCV, que contiene imágenes de tomografía computarizada de varios órganos, y el conjunto de datos CHAOS, que abarca imágenes de tomografía computarizada y resonancia magnética del hígado, riñones y bazo. Nuestro modelo propuesto es una herramienta eficiente y efectiva para la segmentación de imágenes médicas, logrando un rendimiento competitivo en comparación con trabajos anteriores en menos de cinco clics y con un consumo de memoria muy bajo sin necesidad de entrenamiento adicional.