Auto-supervisión para clasificación de imágenes médicas: rendimiento de vanguardia con ~100 muestras de entrenamiento etiquetadas por clase
Autores: Nielsen, Maximilian; Wenderoth, Laura; Sentker, Thilo; Werner, René
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Auto-supervisión para clasificación de imágenes médicas: rendimiento de vanguardia con ~100 muestras de entrenamiento etiquetadas por clase
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Auto-supervisado
Aprendizaje profundo
Análisis de imágenes médicas
Entrenado de extremo a extremo
DL supervisado
Disponibilidad de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
¿Es el aprendizaje profundo (DL) auto-supervisado para el análisis de imágenes médicas ya una alternativa seria al estándar de facto del DL supervisado entrenado de extremo a extremo? Abordamos esta pregunta para la clasificación de imágenes médicas, con un enfoque particular en uno de los factores actualmente más limitantes del campo: la (no) disponibilidad de datos. Basándonos en tres modalidades comunes de imágenes médicas (microscopía de médula ósea, endoscopia gastrointestinal, dermatoscopia) y conjuntos de datos públicamente disponibles, analizamos el rendimiento del DL auto-supervisado dentro del marco de auto-destilación sin etiquetas (DINO). Después de aprender una representación de imagen sin el uso de etiquetas de imagen, se aplican clasificadores de aprendizaje automático convencionales. Los clasificadores se ajustan utilizando un número sistemáticamente variado de datos etiquetados (1-1000 muestras por clase). Explotando la representación de imagen aprendida, logramos un rendimiento de clasificación de vanguardia para las tres modalidades de imagen y conjuntos de datos con solo una fracción de entre el 1% y el 10% de los datos etiquetados disponibles y alrededor de 100 muestras etiquetadas por clase.
Descripción
¿Es el aprendizaje profundo (DL) auto-supervisado para el análisis de imágenes médicas ya una alternativa seria al estándar de facto del DL supervisado entrenado de extremo a extremo? Abordamos esta pregunta para la clasificación de imágenes médicas, con un enfoque particular en uno de los factores actualmente más limitantes del campo: la (no) disponibilidad de datos. Basándonos en tres modalidades comunes de imágenes médicas (microscopía de médula ósea, endoscopia gastrointestinal, dermatoscopia) y conjuntos de datos públicamente disponibles, analizamos el rendimiento del DL auto-supervisado dentro del marco de auto-destilación sin etiquetas (DINO). Después de aprender una representación de imagen sin el uso de etiquetas de imagen, se aplican clasificadores de aprendizaje automático convencionales. Los clasificadores se ajustan utilizando un número sistemáticamente variado de datos etiquetados (1-1000 muestras por clase). Explotando la representación de imagen aprendida, logramos un rendimiento de clasificación de vanguardia para las tres modalidades de imagen y conjuntos de datos con solo una fracción de entre el 1% y el 10% de los datos etiquetados disponibles y alrededor de 100 muestras etiquetadas por clase.