logo móvil
Contáctanos

Marco de aprendizaje de múltiples instancias de doble atención para la clasificación de imágenes completas de patología

Autores: Liu, Dehua; Li, Chengming; Hu, Xiping; Hu, Bin

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Marco de aprendizaje de múltiples instancias de doble atención para la clasificación de imágenes completas de patología


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Diagnóstico asistido por computadora
Imágenes de diapositivas completas de patología
Aprendizaje de múltiples instancias
Marco basado en doble atención
Predicción de clasificación
Camelyon16.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 23

Citaciones: Sin citaciones


Descripción
Los métodos convencionales para el diagnóstico de tumores sufren de dos limitaciones inherentes: son demorados y subjetivos. El diagnóstico asistido por computadora (CAD) es un enfoque importante para abordar estas limitaciones. Las imágenes completas de patología (WSIs) son imágenes de tejido de alta resolución que han realizado contribuciones significativas al diagnóstico del cáncer y la evaluación del pronóstico. Debido a la complejidad de las WSIs y a la disponibilidad de solo etiquetas a nivel de diapositiva, el aprendizaje de múltiples instancias (MIL) se ha convertido en el marco principal para la clasificación de WSIs. Sin embargo, la mayoría de los métodos de MIL no logran capturar la interdependencia entre los parches de imagen dentro de una WSI, lo cual es crucial para una predicción de clasificación precisa. Además, debido a la supervisión débil de las etiquetas a nivel de diapositiva, puede ocurrir sobreajuste durante el proceso de entrenamiento. Para abordar estos problemas, este artículo propone un marco de aprendizaje de múltiples instancias basado en atención dual (DAMIL). DAMIL aprovecha las relaciones espaciales y la información de canal entre los parches de WSI para la predicción de clasificación, sin anotaciones detalladas de tumores a nivel de píxel. La salida del modelo preserva las variaciones semánticas en el espacio latente, mejora la invarianza a las perturbaciones semánticas y proporciona una identificación de clase confiable para la representación final a nivel de diapositiva. Validamos la efectividad de DAMIL en el conjunto de datos público más utilizado, Camelyon16. Los resultados demuestran que DAMIL supera a los métodos de vanguardia en cuanto a precisión de clasificación (ACC), área bajo la curva (AUC) y puntuación F1. Nuestro modelo también permite examinar su interpretabilidad visualizando los pesos de atención dual. Hasta donde sabemos, este es el primer intento de utilizar un mecanismo de doble atención, considerando tanto la información espacial como la del canal, para la clasificación de imágenes completas de diapositivas.

Otros recursos que podrían interesarte

Temas Virtualpro