logo móvil
Contáctanos

La segmentación de vasos retinianos basada en un U-Net ligero y atención inversa

Autores: Hernandez-Gutierrez, Fernando Daniel; Avina-Bravo, Eli Gabriel; Ibarra-Manzano, Mario Alberto; Ruiz-Pinales, Jose; Ovalle-Magallanes, Emmanuel; Avina-Cervantes, Juan Gabriel

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

La segmentación de vasos retinianos basada en un U-Net ligero y atención inversa


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Arquitecturas en forma de U
Segmentación de imágenes médicas
U-net ligero
Atención inversa
Segmentación de vasos sanguíneos retinianos
Operación en tiempo real

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 23

Citaciones: Sin citaciones


Descripción
Las arquitecturas en forma de U han logrado un rendimiento excepcional en la segmentación de imágenes médicas. Su objetivo es extraer características mediante dos caminos simétricos: un codificador y un decodificador. Proponemos un U-Net ligero que incorpora atención inversa y un marco de preprocesamiento para una segmentación precisa de vasos retinianos. Este concepto podría beneficiar a sistemas de reconocimiento portátiles o integrados con recursos limitados para operación en tiempo real. Comparado con el modelo base (7.7 M de parámetros), el modelo U-Net propuesto tiene solo 1.9 M de parámetros y fue probado en los conjuntos de datos DRIVE (Imágenes Retinianas Digitales para Extracción de Vasos), CHASE (Estudio de Corazón y Salud Infantil en Inglaterra) y HRF (Fondo de Retina de Alta Resolución) para análisis de vasos. El modelo propuesto logró coeficientes de Dice y puntajes de IoU de 0.7871 y 0.6318 en el conjunto de datos DRIVE, 0.8036 y 0.6910 en el conjunto de datos de referencia de vasos retinianos CHASE-DB1, así como 0.6902 y 0.5270 en el conjunto de datos HRF, respectivamente. Es notable que la integración del mecanismo de atención inversa contribuyó a una delimitación más precisa de vasos delgados y periféricos, que a menudo no son detectados por modelos convencionales. El modelo constaba de 1.94 millones de parámetros y 12.21 GFLOPs. Además, durante la inferencia, el modelo logró un promedio de velocidad de cuadro de 208 FPS y una latencia de 4.81 ms. Estos hallazgos respaldan la aplicabilidad del modelo propuesto en entornos clínicos y de atención médica móvil del mundo real donde la eficiencia y la precisión son esenciales.

Otros recursos que podrían interesarte

Temas Virtualpro