Red de Colaboración Multi-Marco de Percepción de Ruido para una Mejora en la Detección de Pólipos en Videos Endoscópicos
Autores: Li, Haoran; Zhen, Guoyong; Chu, Chengqun; Ma, Yuting; Zhao, Yongnan
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Red de Colaboración Multi-Marco de Percepción de Ruido para una Mejora en la Detección de Pólipos en Videos Endoscópicos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección
Localización
Pólipos
Exámenes endoscópicos
NSPNet
Análisis de regresión multivariante
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
La detección precisa y localización de pólipos durante exámenes endoscópicos son críticas para el diagnóstico temprano de enfermedades y la prevención del cáncer. Sin embargo, la presencia de artefactos y ruido, junto con la alta similitud entre pólipos y tejidos circundantes en color, forma y textura, complican la detección de pólipos en fotogramas de video. Para abordar estos desafíos, implementamos un análisis de regresión multivariante para refinar el modelo e introdujimos una Red de Percepción Supresora de Ruido (NSPNet) diseñada para un rendimiento mejorado. NSPNet aprovecha la transformada wavelet para mejorar la resistencia del modelo al ruido y artefactos, al tiempo que mejora una estrategia de detección colaborativa multi-frame para la detección dinámica de pólipos en videos endoscópicos, utilizando eficientemente información temporal para fortalecer características a lo largo de los fotogramas. Específicamente, diseñamos un marco de Fusión de Características de Alta y Baja Frecuencia (HFLF), que permite al modelo capturar detalles de alta frecuencia de manera más efectiva. Además, introdujimos un módulo de Detección de Pólipos STFT-LSTM mejorado (SLPD) que utiliza información temporal de secuencias de video para mejorar la fusión de características en entornos dinámicos. Por último, integramos un módulo de Detección de Pólipos con Aumento de Imagen (IAPD) para mejorar el rendimiento en datos no vistos a través de estrategias de mejora de preprocesamiento. Experimentos extensos demuestran que NSPNet supera a nueve métodos SOTA en cuatro conjuntos de datos en métricas clave de rendimiento, incluyendo F1Score y recall.
Descripción
La detección precisa y localización de pólipos durante exámenes endoscópicos son críticas para el diagnóstico temprano de enfermedades y la prevención del cáncer. Sin embargo, la presencia de artefactos y ruido, junto con la alta similitud entre pólipos y tejidos circundantes en color, forma y textura, complican la detección de pólipos en fotogramas de video. Para abordar estos desafíos, implementamos un análisis de regresión multivariante para refinar el modelo e introdujimos una Red de Percepción Supresora de Ruido (NSPNet) diseñada para un rendimiento mejorado. NSPNet aprovecha la transformada wavelet para mejorar la resistencia del modelo al ruido y artefactos, al tiempo que mejora una estrategia de detección colaborativa multi-frame para la detección dinámica de pólipos en videos endoscópicos, utilizando eficientemente información temporal para fortalecer características a lo largo de los fotogramas. Específicamente, diseñamos un marco de Fusión de Características de Alta y Baja Frecuencia (HFLF), que permite al modelo capturar detalles de alta frecuencia de manera más efectiva. Además, introdujimos un módulo de Detección de Pólipos STFT-LSTM mejorado (SLPD) que utiliza información temporal de secuencias de video para mejorar la fusión de características en entornos dinámicos. Por último, integramos un módulo de Detección de Pólipos con Aumento de Imagen (IAPD) para mejorar el rendimiento en datos no vistos a través de estrategias de mejora de preprocesamiento. Experimentos extensos demuestran que NSPNet supera a nueve métodos SOTA en cuatro conjuntos de datos en métricas clave de rendimiento, incluyendo F1Score y recall.