logo móvil
Contáctanos

Un análisis crítico de modelos generativos para la ampliación de datos sintéticos en datos limitados de radiografías de neumonía

Autores: Schaudt, Daniel; Späte, Christian; von Schwerin, Reinhold; Reichert, Manfred; von Schwerin, Marianne; Beer, Meinrad; Kloth, Christopher

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Un análisis crítico de modelos generativos para la ampliación de datos sintéticos en datos limitados de radiografías de neumonía


Categoría

Ingeniería y Tecnología

Subcategoría

Bioingeniería

Palabras clave

Imágenes médicas
Modelos de aprendizaje profundo
Modelos generativos
Datos sintéticos
Tarea de clasificación
Neumonía

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 28

Citaciones: Sin citaciones


Descripción
En la imagen médica, los modelos de aprendizaje profundo sirven como herramientas invaluables para acelerar diagnósticos y ayudar a profesionales médicos especializados en la toma de decisiones clínicas. Sin embargo, entrenar efectivamente modelos de aprendizaje profundo generalmente requiere cantidades sustanciales de datos de alta calidad, un recurso que a menudo escasea en numerosos escenarios de imágenes médicas. Una forma de superar esta deficiencia es generar artificialmente dichas imágenes. Por lo tanto, en este estudio comparativo entrenamos cinco modelos generativos para aumentar artificialmente la cantidad de datos disponibles en dicho escenario. Este enfoque de datos sintéticos se evalúa en una tarea de clasificación posterior, prediciendo cuatro causas de neumonía, así como casos saludables en 1082 imágenes de radiografías de tórax. Las evaluaciones cuantitativas y médicas muestran que un enfoque basado en Redes Generativas Adversarias (GAN) supera significativamente a enfoques más recientes basados en difusión en este conjunto de datos limitado, con una mejor calidad de imagen y plausibilidad patológica. Mostramos que una mejor calidad de imagen sorprendentemente no se traduce en un mejor rendimiento de clasificación al evaluar cinco modelos de clasificación diferentes y variar la cantidad de datos de entrenamiento adicionales. Métricas específicas de clase como precisión, recall y puntuación F1 muestran una mejora sustancial al utilizar imágenes sintéticas, enfatizando el efecto de reequilibrio de datos de clases menos frecuentes. Sin embargo, el rendimiento general no mejora para la mayoría de los modelos y configuraciones, excepto para un enfoque DreamBooth que muestra una mejora de +0,52 en la precisión general. La gran variabilidad del impacto en el rendimiento en este estudio sugiere una consideración cuidadosa al utilizar modelos generativos para escenarios de datos limitados, especialmente con una inesperada correlación negativa entre la calidad de la imagen y la mejora en la clasificación posterior.

Otros recursos que podrían interesarte

Temas Virtualpro