Un análisis crítico de modelos generativos para la ampliación de datos sintéticos en datos limitados de radiografías de neumonía
Autores: Schaudt, Daniel; Späte, Christian; von Schwerin, Reinhold; Reichert, Manfred; von Schwerin, Marianne; Beer, Meinrad; Kloth, Christopher
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un análisis crítico de modelos generativos para la ampliación de datos sintéticos en datos limitados de radiografías de neumonía
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Imágenes médicas
Modelos de aprendizaje profundo
Modelos generativos
Datos sintéticos
Tarea de clasificación
Neumonía
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
En la imagen médica, los modelos de aprendizaje profundo sirven como herramientas invaluables para acelerar diagnósticos y ayudar a profesionales médicos especializados en la toma de decisiones clínicas. Sin embargo, entrenar efectivamente modelos de aprendizaje profundo generalmente requiere cantidades sustanciales de datos de alta calidad, un recurso que a menudo escasea en numerosos escenarios de imágenes médicas. Una forma de superar esta deficiencia es generar artificialmente dichas imágenes. Por lo tanto, en este estudio comparativo entrenamos cinco modelos generativos para aumentar artificialmente la cantidad de datos disponibles en dicho escenario. Este enfoque de datos sintéticos se evalúa en una tarea de clasificación posterior, prediciendo cuatro causas de neumonía, así como casos saludables en 1082 imágenes de radiografías de tórax. Las evaluaciones cuantitativas y médicas muestran que un enfoque basado en Redes Generativas Adversarias (GAN) supera significativamente a enfoques más recientes basados en difusión en este conjunto de datos limitado, con una mejor calidad de imagen y plausibilidad patológica. Mostramos que una mejor calidad de imagen sorprendentemente no se traduce en un mejor rendimiento de clasificación al evaluar cinco modelos de clasificación diferentes y variar la cantidad de datos de entrenamiento adicionales. Métricas específicas de clase como precisión, recall y puntuación F1 muestran una mejora sustancial al utilizar imágenes sintéticas, enfatizando el efecto de reequilibrio de datos de clases menos frecuentes. Sin embargo, el rendimiento general no mejora para la mayoría de los modelos y configuraciones, excepto para un enfoque DreamBooth que muestra una mejora de +0,52 en la precisión general. La gran variabilidad del impacto en el rendimiento en este estudio sugiere una consideración cuidadosa al utilizar modelos generativos para escenarios de datos limitados, especialmente con una inesperada correlación negativa entre la calidad de la imagen y la mejora en la clasificación posterior.
Descripción
En la imagen médica, los modelos de aprendizaje profundo sirven como herramientas invaluables para acelerar diagnósticos y ayudar a profesionales médicos especializados en la toma de decisiones clínicas. Sin embargo, entrenar efectivamente modelos de aprendizaje profundo generalmente requiere cantidades sustanciales de datos de alta calidad, un recurso que a menudo escasea en numerosos escenarios de imágenes médicas. Una forma de superar esta deficiencia es generar artificialmente dichas imágenes. Por lo tanto, en este estudio comparativo entrenamos cinco modelos generativos para aumentar artificialmente la cantidad de datos disponibles en dicho escenario. Este enfoque de datos sintéticos se evalúa en una tarea de clasificación posterior, prediciendo cuatro causas de neumonía, así como casos saludables en 1082 imágenes de radiografías de tórax. Las evaluaciones cuantitativas y médicas muestran que un enfoque basado en Redes Generativas Adversarias (GAN) supera significativamente a enfoques más recientes basados en difusión en este conjunto de datos limitado, con una mejor calidad de imagen y plausibilidad patológica. Mostramos que una mejor calidad de imagen sorprendentemente no se traduce en un mejor rendimiento de clasificación al evaluar cinco modelos de clasificación diferentes y variar la cantidad de datos de entrenamiento adicionales. Métricas específicas de clase como precisión, recall y puntuación F1 muestran una mejora sustancial al utilizar imágenes sintéticas, enfatizando el efecto de reequilibrio de datos de clases menos frecuentes. Sin embargo, el rendimiento general no mejora para la mayoría de los modelos y configuraciones, excepto para un enfoque DreamBooth que muestra una mejora de +0,52 en la precisión general. La gran variabilidad del impacto en el rendimiento en este estudio sugiere una consideración cuidadosa al utilizar modelos generativos para escenarios de datos limitados, especialmente con una inesperada correlación negativa entre la calidad de la imagen y la mejora en la clasificación posterior.