Diagnóstico rápido y preciso de enfermedades gastrointestinales: aprendizaje en imágenes de endoscopia utilizando un transformador ligero con atención a características locales
Autores: Wu, Shibin; Zhang, Ruxin; Yan, Jiayi; Li, Chengquan; Liu, Qicai; Wang, Liyang; Wang, Haoqian
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Diagnóstico rápido y preciso de enfermedades gastrointestinales: aprendizaje en imágenes de endoscopia utilizando un transformador ligero con atención a características locales
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Diagnóstico de enfermedades
Tracto gastrointestinal
FLATer
Modelo basado en transformadores
Imágenes endoscópicas
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Ante la apremiante necesidad de un diagnóstico sólido de enfermedades a partir de imágenes endoscópicas del tracto gastrointestinal (GIT), propusimos FLATer, un modelo rápido, ligero y altamente preciso basado en transformers. FLATer consta de un bloque residual, un módulo de transformer de visión y un bloque de atención espacial, que se enfoca simultáneamente en características locales y atención global. Puede aprovechar las capacidades tanto de redes neuronales convolucionales (CNN) como de transformers de visión (ViT). Descomponemos la clasificación de imágenes endoscópicas en dos subtareas: una clasificación binaria para discernir entre imágenes normales y patológicas y una clasificación multiclase adicional para categorizar imágenes en enfermedades específicas, a saber, colitis ulcerosa, pólipos y esofagitis. FLATer ha demostrado una habilidad excepcional en estas tareas, logrando un 96.4% de precisión en la clasificación binaria y un 99.7% de precisión en la clasificación ternaria, superando a la mayoría de los modelos existentes. Notablemente, FLATer pudo mantener un rendimiento impresionante cuando se entrenó desde cero, subrayando su robustez. Además de la alta precisión, FLATer presumió de una eficiencia notable, alcanzando un notable rendimiento de 16.4k imágenes por segundo, lo que posiciona a FLATer como un candidato convincente para la identificación rápida de enfermedades en la práctica clínica.
Descripción
Ante la apremiante necesidad de un diagnóstico sólido de enfermedades a partir de imágenes endoscópicas del tracto gastrointestinal (GIT), propusimos FLATer, un modelo rápido, ligero y altamente preciso basado en transformers. FLATer consta de un bloque residual, un módulo de transformer de visión y un bloque de atención espacial, que se enfoca simultáneamente en características locales y atención global. Puede aprovechar las capacidades tanto de redes neuronales convolucionales (CNN) como de transformers de visión (ViT). Descomponemos la clasificación de imágenes endoscópicas en dos subtareas: una clasificación binaria para discernir entre imágenes normales y patológicas y una clasificación multiclase adicional para categorizar imágenes en enfermedades específicas, a saber, colitis ulcerosa, pólipos y esofagitis. FLATer ha demostrado una habilidad excepcional en estas tareas, logrando un 96.4% de precisión en la clasificación binaria y un 99.7% de precisión en la clasificación ternaria, superando a la mayoría de los modelos existentes. Notablemente, FLATer pudo mantener un rendimiento impresionante cuando se entrenó desde cero, subrayando su robustez. Además de la alta precisión, FLATer presumió de una eficiencia notable, alcanzando un notable rendimiento de 16.4k imágenes por segundo, lo que posiciona a FLATer como un candidato convincente para la identificación rápida de enfermedades en la práctica clínica.