logo móvil
Contáctanos

Clasificación de imágenes médicas con un modelo SSM híbrido basado en CNN y Transformer

Autores: Hu, Can; Cao, Ning; Zhou, Han; Guo, Bin

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Clasificación de imágenes médicas con un modelo SSM híbrido basado en CNN y Transformer


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Clasificación de imágenes médicas
Redes neuronales convolucionales
Transformadores
Modelo híbrido
Modelo MambaConvT
Extracción de características

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
La clasificación de imágenes médicas, una tarea fundamental para la precisión diagnóstica, plantea desafíos únicos debido a la naturaleza intrincada y variable de las imágenes médicas en comparación con sus contrapartes naturales. Aunque las Redes Neuronales Convolucionales (CNNs) y los Transformadores son prevalentes en este dominio, cada arquitectura tiene sus inconvenientes. Las CNNs, a pesar de su fortaleza en la extracción de características locales, carecen de capturar el contexto global, mientras que los Transformadores sobresalen en la información global pero pueden pasar por alto detalles finos. La integración de CNNs y Transformadores en un modelo híbrido tiene como objetivo cerrar esta brecha al permitir la extracción simultánea de características locales y globales. Sin embargo, este enfoque sigue siendo limitado en su capacidad para modelar dependencias a largo plazo, lo que dificulta la extracción eficiente de características distantes. Para abordar estos problemas, presentamos el modelo MambaConvT, que emplea un enfoque de espacio de estados. Comienza procesando localmente características de entrada a través de convolución multicore, mejorando la extracción de detalles locales profundos y discriminativos. Luego, se emplea la convolución separable en profundidad con un módulo de escaneo selectivo 2D (SS2D) para mantener un campo receptivo global y establecer conexiones a larga distancia, capturando las características detalladas. El modelo luego combina características híbridas para una extracción de características integral, seguida de un modelado de características globales para enfatizar la información detallada global y optimizar la representación de características. Este artículo realiza experimentos de rendimiento exhaustivos en diferentes algoritmos en cuatro conjuntos de datos públicos y dos conjuntos de datos privados. Los resultados demuestran que MambaConvT supera a los últimos algoritmos de clasificación en términos de precisión, recall, puntuación F1 y valor AUC, logrando un rendimiento superior en la clasificación precisa de imágenes médicas.

Otros recursos que podrían interesarte

Temas Virtualpro