Synergizando el preprocesamiento habilitado por el aprendizaje profundo y la integración humano-AI para una generación eficiente de verdades de terreno automáticas
Autores: Collazo, Christopher; Vargas, Ian; Cara, Brendon; Weinheimer, Carla J.; Grabau, Ryan P.; Goldgof, Dmitry; Hall, Lawrence; Wickline, Samuel A.; Pan, Hua
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Synergizando el preprocesamiento habilitado por el aprendizaje profundo y la integración humano-AI para una generación eficiente de verdades de terreno automáticas
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Aprendizaje profundo
Interpretación de imágenes médicas
Aprendizaje activo
Etiquetado de verdad terreno
Imágenes de todo la diapositiva
Sobreajuste
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
El progreso en la incorporación del aprendizaje profundo en el campo de la interpretación de imágenes médicas se ha visto grandemente obstaculizado debido al tremendo costo y tiempo asociado con la generación de la verdad fundamental para el aprendizaje automático supervisado, junto con preocupaciones sobre la calidad inconsistente de las imágenes adquiridas. El aprendizaje activo ofrece una solución potencial a estos problemas de expansión de la verdad fundamental del conjunto de datos mediante la selección algorítmica de las muestras más informativas para el etiquetado de la verdad fundamental. Sin embargo, este esfuerzo incurre en costos de etiquetado humano, los cuales necesitan ser minimizados. Además, los enfoques de etiquetado automático que emplean aprendizaje activo a menudo exhiben tendencias de sobreajuste al seleccionar muestras estrechamente alineadas con la distribución del conjunto de entrenamiento y excluir muestras fuera de distribución, lo cual podría potencialmente mejorar la efectividad del modelo. Proponemos que la mayoría de las instancias fuera de distribución pueden atribuirse a imágenes cruzadas inconsistentes. Desde que la FDA aprobó el primer sistema de imágenes de todo el corte para diagnóstico médico en 2017, las imágenes de todo el corte han proporcionado información crítica enriquecida para avanzar en el campo de la histopatología automatizada. Aquí, ejemplificamos los beneficios de una novedosa estrategia de aprendizaje profundo que utiliza imágenes microscópicas de todo el corte de alta resolución. Evaluamos cuantitativamente y resaltamos visualmente las inconsistencias dentro del conjunto de datos de imágenes de todo el corte utilizado en este estudio. En consecuencia, presentamos un algoritmo de preprocesamiento basado en aprendizaje profundo diseñado para normalizar muestras desconocidas a la distribución del conjunto de entrenamiento, mitigando efectivamente el problema de sobreajuste. Como resultado, nuestro enfoque aumenta significativamente la cantidad de etiquetado automático de regiones de interés en imágenes de todo el corte de alta resolución utilizando aprendizaje profundo activo. Aceptamos el 92% de las etiquetas automáticas generadas para nuestra cohorte de datos no etiquetados, expandiendo el conjunto de datos etiquetado en un 845%. Además, demostramos un ahorro de tiempo de experto del 96% en relación con el etiquetado manual de la verdad fundamental por expertos.
Descripción
El progreso en la incorporación del aprendizaje profundo en el campo de la interpretación de imágenes médicas se ha visto grandemente obstaculizado debido al tremendo costo y tiempo asociado con la generación de la verdad fundamental para el aprendizaje automático supervisado, junto con preocupaciones sobre la calidad inconsistente de las imágenes adquiridas. El aprendizaje activo ofrece una solución potencial a estos problemas de expansión de la verdad fundamental del conjunto de datos mediante la selección algorítmica de las muestras más informativas para el etiquetado de la verdad fundamental. Sin embargo, este esfuerzo incurre en costos de etiquetado humano, los cuales necesitan ser minimizados. Además, los enfoques de etiquetado automático que emplean aprendizaje activo a menudo exhiben tendencias de sobreajuste al seleccionar muestras estrechamente alineadas con la distribución del conjunto de entrenamiento y excluir muestras fuera de distribución, lo cual podría potencialmente mejorar la efectividad del modelo. Proponemos que la mayoría de las instancias fuera de distribución pueden atribuirse a imágenes cruzadas inconsistentes. Desde que la FDA aprobó el primer sistema de imágenes de todo el corte para diagnóstico médico en 2017, las imágenes de todo el corte han proporcionado información crítica enriquecida para avanzar en el campo de la histopatología automatizada. Aquí, ejemplificamos los beneficios de una novedosa estrategia de aprendizaje profundo que utiliza imágenes microscópicas de todo el corte de alta resolución. Evaluamos cuantitativamente y resaltamos visualmente las inconsistencias dentro del conjunto de datos de imágenes de todo el corte utilizado en este estudio. En consecuencia, presentamos un algoritmo de preprocesamiento basado en aprendizaje profundo diseñado para normalizar muestras desconocidas a la distribución del conjunto de entrenamiento, mitigando efectivamente el problema de sobreajuste. Como resultado, nuestro enfoque aumenta significativamente la cantidad de etiquetado automático de regiones de interés en imágenes de todo el corte de alta resolución utilizando aprendizaje profundo activo. Aceptamos el 92% de las etiquetas automáticas generadas para nuestra cohorte de datos no etiquetados, expandiendo el conjunto de datos etiquetado en un 845%. Además, demostramos un ahorro de tiempo de experto del 96% en relación con el etiquetado manual de la verdad fundamental por expertos.