Clasificación de imágenes médicas con un modelo SSM híbrido basado en CNN y Transformer

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Clasificación de imágenes médicas con un modelo SSM híbrido basado en CNN y Transformer

Autores: Hu, Can; Cao, Ning; Zhou, Han; Guo, Bin

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Clasificación de imágenes médicas con un modelo SSM híbrido basado en CNN y Transformer

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Clasificación de imágenes médicas

Redes neuronales convolucionales

Transformadores

Modelo híbrido

Modelo MambaConvT

Extracción de características

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones

La clasificación de imágenes médicas, una tarea fundamental para la precisión diagnóstica, plantea desafíos únicos debido a la naturaleza intrincada y variable de las imágenes médicas en comparación con sus contrapartes naturales. Aunque las Redes Neuronales Convolucionales (CNNs) y los Transformadores son prevalentes en este dominio, cada arquitectura tiene sus inconvenientes. Las CNNs, a pesar de su fortaleza en la extracción de características locales, carecen de capturar el contexto global, mientras que los Transformadores sobresalen en la información global pero pueden pasar por alto detalles finos. La integración de CNNs y Transformadores en un modelo híbrido tiene como objetivo cerrar esta brecha al permitir la extracción simultánea de características locales y globales. Sin embargo, este enfoque sigue siendo limitado en su capacidad para modelar dependencias a largo plazo, lo que dificulta la extracción eficiente de características distantes. Para abordar estos problemas, presentamos el modelo MambaConvT, que emplea un enfoque de espacio de estados. Comienza procesando localmente características de entrada a través de convolución multicore, mejorando la extracción de detalles locales profundos y discriminativos. Luego, se emplea la convolución separable en profundidad con un módulo de escaneo selectivo 2D (SS2D) para mantener un campo receptivo global y establecer conexiones a larga distancia, capturando las características detalladas. El modelo luego combina características híbridas para una extracción de características integral, seguida de un modelado de características globales para enfatizar la información detallada global y optimizar la representación de características. Este artículo realiza experimentos de rendimiento exhaustivos en diferentes algoritmos en cuatro conjuntos de datos públicos y dos conjuntos de datos privados. Los resultados demuestran que MambaConvT supera a los últimos algoritmos de clasificación en términos de precisión, recall, puntuación F1 y valor AUC, logrando un rendimiento superior en la clasificación precisa de imágenes médicas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro