Prerade: marco de evaluación de tareas de preentrenamiento en imágenes y reportes de radiología
Autores: Coleman, Matthew; Dipnall, Joanna F.; Jung, Myong Chol; Du, Lan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Prerade: marco de evaluación de tareas de preentrenamiento en imágenes y reportes de radiología
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Transformadores
Tareas de preentrenamiento
Aplicaciones de radiología
Imágenes
Informes de radiología
MIMIC-CXR
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Recientemente, el preentrenamiento auto-supervisado de transformadores ha ganado considerable atención en el análisis de registros médicos electrónicos. Sin embargo, aún falta una evaluación sistemática de diferentes tareas de preentrenamiento en aplicaciones de radiología que utilicen tanto imágenes como informes radiológicos. Proponemos PreRadE, un marco de concepto simple que permite una evaluación novedosa de tareas de preentrenamiento en un entorno controlado. Investigamos tres tareas de preentrenamiento más comúnmente utilizadas (MLM-Modelado de Lenguaje Enmascarado, MFR-Regresión de Características Enmascaradas e ITM-Coincidencia de Imagen a Texto) y sus combinaciones en comparación con la clasificación radiológica en MIMIC-CXR, un conjunto de datos de imágenes de radiografías de tórax médicas e informes de texto radiológico. Nuestros experimentos en el entorno multimodal muestran que (1) el preentrenamiento con MLM proporciona el mayor beneficio al rendimiento de la clasificación, en gran parte debido a la información relevante para la tarea aprendida de los informes radiológicos. (2) El preentrenamiento con una sola tarea puede introducir variación en el rendimiento de la clasificación en diferentes episodios de ajuste fino, lo que sugiere que los objetivos de tareas compuestas que incorporan tanto imágenes como modalidades de texto son más adecuados para generar modelos confiables y con buen rendimiento.
Descripción
Recientemente, el preentrenamiento auto-supervisado de transformadores ha ganado considerable atención en el análisis de registros médicos electrónicos. Sin embargo, aún falta una evaluación sistemática de diferentes tareas de preentrenamiento en aplicaciones de radiología que utilicen tanto imágenes como informes radiológicos. Proponemos PreRadE, un marco de concepto simple que permite una evaluación novedosa de tareas de preentrenamiento en un entorno controlado. Investigamos tres tareas de preentrenamiento más comúnmente utilizadas (MLM-Modelado de Lenguaje Enmascarado, MFR-Regresión de Características Enmascaradas e ITM-Coincidencia de Imagen a Texto) y sus combinaciones en comparación con la clasificación radiológica en MIMIC-CXR, un conjunto de datos de imágenes de radiografías de tórax médicas e informes de texto radiológico. Nuestros experimentos en el entorno multimodal muestran que (1) el preentrenamiento con MLM proporciona el mayor beneficio al rendimiento de la clasificación, en gran parte debido a la información relevante para la tarea aprendida de los informes radiológicos. (2) El preentrenamiento con una sola tarea puede introducir variación en el rendimiento de la clasificación en diferentes episodios de ajuste fino, lo que sugiere que los objetivos de tareas compuestas que incorporan tanto imágenes como modalidades de texto son más adecuados para generar modelos confiables y con buen rendimiento.