WGCAMNet: Red Generativa Antagónica de Wasserstein Aumentada y Mecanismo de Atención Personalizado Basado en Red Neuronal Profunda para la Detección y Clasificación Mejorada de Tumores Cerebrales
Autores: Alam, Fatema Binte; Fahim, Tahasin Ahmed; Asef, Md; Hossain, Md Azad; Dewan, M. Ali Akber
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
WGCAMNet: Red Generativa Antagónica de Wasserstein Aumentada y Mecanismo de Atención Personalizado Basado en Red Neuronal Profunda para la Detección y Clasificación Mejorada de Tumores Cerebrales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Tumor cerebral
Aprendizaje profundo
Imágenes de MRI
Red Generativa Antagónica de Wasserstein
Aumento de datos
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección de tumores cerebrales y la categorización de sus subtipos son esenciales para un diagnóstico temprano y para mejorar los resultados en los pacientes. Esta investigación presenta un enfoque innovador que emplea metodologías avanzadas de aumento de datos y aprendizaje profundo para la clasificación de tumores cerebrales. Para este trabajo, se consideró un conjunto de datos de 6982 imágenes de resonancia magnética del IEEE Data Port, en el cual se utilizaron un total de 5712 imágenes de cuatro clases (1321 glioma, 1339 meningioma, 1595 sin tumor y 1457 pituitaria) en el conjunto de entrenamiento y un total de 1270 imágenes de las mismas cuatro clases en el conjunto de prueba. Se implementó una Red Generativa Antagónica de Wasserstein para generar imágenes sintéticas y abordar el desequilibrio de clases, lo que resultó en un conjunto de datos equilibrado y consistente. Se realizó una comparación entre varias metodologías de aumento de datos, demostrando que los resultados aumentados por la Red Generativa Antagónica de Wasserstein tienen un rendimiento excelente en comparación con el aumento tradicional (como rotación, desplazamiento, zoom, etc.) y sin aumento. Además, se aplicó un filtro gaussiano y normalización durante el preprocesamiento para reducir el ruido, destacando su superior precisión y preservación de bordes al comparar su rendimiento con los filtros mediana y bilateral. El modelo clasificador combina la extracción de características paralelas de InceptionV3 y VGG19 modificados, seguidos de mecanismos de atención personalizados para capturar eficazmente las características de cada tipo de tumor. El modelo se entrenó durante 64 épocas utilizando puntos de control del modelo para guardar el modelo de mejor rendimiento basado en la precisión de validación y ajustes de la tasa de aprendizaje. El modelo logró una tasa de precisión del 99.61% en el conjunto de prueba, con precisión, recuperación, AUC y pérdida de 0.9960, 0.9960, 0.0153 y 0.9999, respectivamente. La explicabilidad de la arquitectura propuesta se ha mejorado mediante gráficos t-SNE, que muestran clústeres únicos de tumores, y representaciones Grad-CAM, que destacan áreas cruciales en las exploraciones de resonancia magnética. Esta investigación muestra un enfoque explicable y robusto para clasificar correctamente cuatro tipos de tumores cerebrales, combinando datos aumentados por WGAN con modelos avanzados de aprendizaje profundo en la extracción de características. El marco gestiona eficazmente el desequilibrio de clases e integra un mecanismo de atención personalizado, superando a otros modelos, mejorando así la precisión y fiabilidad diagnóstica en entornos clínicos.
Descripción
La detección de tumores cerebrales y la categorización de sus subtipos son esenciales para un diagnóstico temprano y para mejorar los resultados en los pacientes. Esta investigación presenta un enfoque innovador que emplea metodologías avanzadas de aumento de datos y aprendizaje profundo para la clasificación de tumores cerebrales. Para este trabajo, se consideró un conjunto de datos de 6982 imágenes de resonancia magnética del IEEE Data Port, en el cual se utilizaron un total de 5712 imágenes de cuatro clases (1321 glioma, 1339 meningioma, 1595 sin tumor y 1457 pituitaria) en el conjunto de entrenamiento y un total de 1270 imágenes de las mismas cuatro clases en el conjunto de prueba. Se implementó una Red Generativa Antagónica de Wasserstein para generar imágenes sintéticas y abordar el desequilibrio de clases, lo que resultó en un conjunto de datos equilibrado y consistente. Se realizó una comparación entre varias metodologías de aumento de datos, demostrando que los resultados aumentados por la Red Generativa Antagónica de Wasserstein tienen un rendimiento excelente en comparación con el aumento tradicional (como rotación, desplazamiento, zoom, etc.) y sin aumento. Además, se aplicó un filtro gaussiano y normalización durante el preprocesamiento para reducir el ruido, destacando su superior precisión y preservación de bordes al comparar su rendimiento con los filtros mediana y bilateral. El modelo clasificador combina la extracción de características paralelas de InceptionV3 y VGG19 modificados, seguidos de mecanismos de atención personalizados para capturar eficazmente las características de cada tipo de tumor. El modelo se entrenó durante 64 épocas utilizando puntos de control del modelo para guardar el modelo de mejor rendimiento basado en la precisión de validación y ajustes de la tasa de aprendizaje. El modelo logró una tasa de precisión del 99.61% en el conjunto de prueba, con precisión, recuperación, AUC y pérdida de 0.9960, 0.9960, 0.0153 y 0.9999, respectivamente. La explicabilidad de la arquitectura propuesta se ha mejorado mediante gráficos t-SNE, que muestran clústeres únicos de tumores, y representaciones Grad-CAM, que destacan áreas cruciales en las exploraciones de resonancia magnética. Esta investigación muestra un enfoque explicable y robusto para clasificar correctamente cuatro tipos de tumores cerebrales, combinando datos aumentados por WGAN con modelos avanzados de aprendizaje profundo en la extracción de características. El marco gestiona eficazmente el desequilibrio de clases e integra un mecanismo de atención personalizado, superando a otros modelos, mejorando así la precisión y fiabilidad diagnóstica en entornos clínicos.