logo móvil
Contáctanos

Mil-ct: aprendizaje de instancias múltiples a través de un transformador de escala cruzada para mejorar la detección de reflejo de luz arterial

Autores: Gao, Yuan; Ma, Chenbin; Guo, Lishuang; Zhang, Xuxiang; Ji, Xunming

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Mil-ct: aprendizaje de instancias múltiples a través de un transformador de escala cruzada para mejorar la detección de reflejo de luz arterial


Categoría

Ingeniería y Tecnología

Subcategoría

Bioingeniería

Palabras clave

Aterosclerosis sistémica
EALR
Imágenes de fondo de ojo
Método MIL-CT
Lesiones retinianas
Aprendizaje de múltiples instancias

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
Una de las primeras manifestaciones de la aterosclerosis sistémica, que conduce a problemas de circulación sanguínea, es el reflejo luminoso arterial mejorado (EALR). Las imágenes de fondo de ojo se utilizan comúnmente con fines de detección regular para intervenir y evaluar la gravedad de la aterosclerosis sistémica de manera oportuna. Sin embargo, existe una falta de métodos automatizados que puedan cumplir con las demandas de detección a gran escala en la población. Por lo tanto, este estudio presenta un nuevo método de aprendizaje multi-instancia basado en transformadores de escala cruzada, llamado MIL-CT, para la detección de lesiones arteriales tempranas (por ejemplo, EALR) en imágenes de fondo de ojo. MIL-CT utiliza el transformador de visión de escala cruzada para extraer características retinianas en un dominio perceptual de multi-granularidad. Incorpora un módulo de fusión de atención multi-cabeza de escala cruzada para mejorar la capacidad perceptual global y la representación de características. Al integrar información de diferentes escalas y minimizar la pérdida de información, el método mejora significativamente el rendimiento de la tarea de detección de EALR. Además, se implementa un módulo de aprendizaje multi-instancia para permitir que el modelo comprenda mejor los detalles locales y las características en las imágenes de fondo de ojo, facilitando la clasificación de tokens de parche relacionados con lesiones retinianas. Para aprender efectivamente las características asociadas con lesiones retinianas, utilizamos pesos pre-entrenados en un gran conjunto de datos de Kaggle de imágenes de fondo de ojo. Nuestros experimentos de validación y comparación realizados en nuestro conjunto de datos de EALR recopilado demuestran la efectividad del método MIL-CT en la reducción de errores de generalización mientras mantiene una atención eficiente a los detalles vasculares retinianos. Además, el método supera a los modelos existentes en la detección de EALR, logrando una precisión, sensibilidad, especificidad y puntuación F1 del 97,62%, 97,63%, 97,05%, 96,48% y 97,62%, respectivamente. Estos resultados muestran el significativo aumento en la precisión diagnóstica de las imágenes de fondo de ojo generado por el método MIL-CT. Por lo tanto, tiene potencial para diversas aplicaciones, especialmente en la detección temprana de enfermedades cardiovasculares como la hipertensión y la aterosclerosis.

Otros recursos que podrían interesarte

Temas Virtualpro