LightCF-Net: una red de fusión de contexto de largo alcance ligera para la segmentación de pólipos en tiempo real
Autores: Ji, Zhanlin; Li, Xiaoyu; Liu, Jianuo; Chen, Rui; Liao, Qinping; Lyu, Tao; Zhao, Li
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
LightCF-Net: una red de fusión de contexto de largo alcance ligera para la segmentación de pólipos en tiempo real
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Segmentación
Pólipos
Videos de colonoscopia
Automático
Métodos de segmentación
Rendimiento en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La segmentación automática de pólipos a partir de videos de colonoscopia es crucial para el desarrollo de sistemas de diagnóstico asistido por computadora para el cáncer colorrectal. Los métodos existentes de segmentación automática de pólipos a menudo tienen dificultades para cumplir con las demandas en tiempo real de las aplicaciones clínicas debido a su considerable cantidad de parámetros y carga computacional, especialmente aquellos basados en arquitecturas de Transformador. Para abordar estos desafíos, se propone en este documento una nueva red de fusión de contexto a largo plazo ligera, llamada LightCF-Net. Esta red intenta modelar dependencias espaciales a largo plazo manteniendo un rendimiento en tiempo real, para distinguir mejor los pólipos del ruido de fondo y así mejorar la precisión de la segmentación. Se diseña un novedoso Codificador de Atención de Fusión (FAEncoder) en la red propuesta, que integra Mecanismos de Atención de Núcleo Grande (LKA) y de atención de canal para extraer características representativas profundas de los pólipos y descubrir dependencias a largo plazo. Además, se agrega un módulo Visual de Atención Mamba (VAM) recién diseñado a las conexiones de salto, modelando dependencias de contexto a largo plazo en las características extraídas del codificador y reduciendo la interferencia del ruido de fondo a través del mecanismo de atención. Finalmente, se utiliza un módulo de Atención Dividida en Pirámide (PSA) en la capa de cuello de botella para extraer características contextuales multinivel más ricas. El método propuesto se evaluó exhaustivamente en cuatro conjuntos de datos de segmentación de pólipos de renombre: Kvasir-SEG, CVC-ClinicDB, BKAI-IGH y ETIS. Los hallazgos experimentales demuestran que el método propuesto ofrece una mayor precisión de segmentación en menos tiempo, superando consistentemente a las redes de segmentación de pólipos ligeras más avanzadas.
Descripción
La segmentación automática de pólipos a partir de videos de colonoscopia es crucial para el desarrollo de sistemas de diagnóstico asistido por computadora para el cáncer colorrectal. Los métodos existentes de segmentación automática de pólipos a menudo tienen dificultades para cumplir con las demandas en tiempo real de las aplicaciones clínicas debido a su considerable cantidad de parámetros y carga computacional, especialmente aquellos basados en arquitecturas de Transformador. Para abordar estos desafíos, se propone en este documento una nueva red de fusión de contexto a largo plazo ligera, llamada LightCF-Net. Esta red intenta modelar dependencias espaciales a largo plazo manteniendo un rendimiento en tiempo real, para distinguir mejor los pólipos del ruido de fondo y así mejorar la precisión de la segmentación. Se diseña un novedoso Codificador de Atención de Fusión (FAEncoder) en la red propuesta, que integra Mecanismos de Atención de Núcleo Grande (LKA) y de atención de canal para extraer características representativas profundas de los pólipos y descubrir dependencias a largo plazo. Además, se agrega un módulo Visual de Atención Mamba (VAM) recién diseñado a las conexiones de salto, modelando dependencias de contexto a largo plazo en las características extraídas del codificador y reduciendo la interferencia del ruido de fondo a través del mecanismo de atención. Finalmente, se utiliza un módulo de Atención Dividida en Pirámide (PSA) en la capa de cuello de botella para extraer características contextuales multinivel más ricas. El método propuesto se evaluó exhaustivamente en cuatro conjuntos de datos de segmentación de pólipos de renombre: Kvasir-SEG, CVC-ClinicDB, BKAI-IGH y ETIS. Los hallazgos experimentales demuestran que el método propuesto ofrece una mayor precisión de segmentación en menos tiempo, superando consistentemente a las redes de segmentación de pólipos ligeras más avanzadas.