Enfoque de fusión a nivel de píxel con Vision Transformer para la detección temprana de la enfermedad de Alzheimer
Autores: Odusami, Modupe; Maskelinas, Rytis; Damaeviius, Robertas
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Enfoque de fusión a nivel de píxel con Vision Transformer para la detección temprana de la enfermedad de Alzheimer
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Enfermedad de Alzheimer
Neuroimagen multimodal
Resonancia magnética
Tomografía por emisión de positrones
Transformada discreta de wavelet
Red neuronal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
La enfermedad de Alzheimer (EA) se ha convertido en un grave peligro para la salud humana en los últimos años, y el cribado y diagnóstico adecuados de la EA siguen siendo un desafío. La entrada multimodal de neuroimagen puede ayudar a identificar la EA en las etapas tempranas de deterioro cognitivo leve (DCL) y en las etapas tardías de DCL a partir del desarrollo cognitivo normal utilizando resonancia magnética (RM) y tomografía por emisión de positrones (PET). La RM proporciona información útil sobre las anormalidades estructurales del cerebro, mientras que los datos PET proporcionan la diferencia entre los cambios fisiológicos y patológicos en la anatomía cerebral. La precisión del diagnóstico de la EA puede aumentar cuando se combinan estos datos. Sin embargo, son heterogéneos y apropiados, y se requiere un número adecuado de características para la clasificación de la EA. Este artículo propone un enfoque de fusión multimodal que utiliza una técnica matemática llamada transformada discreta de ondícula (DWT) para analizar los datos, y la optimización de esta técnica se logra mediante el aprendizaje por transferencia utilizando una red neuronal preentrenada llamada VGG16. La imagen fusionada final se reconstruye utilizando la transformada discreta inversa de ondícula (IDWT). Las imágenes fusionadas se clasifican utilizando un transformador de visión preentrenado. La evaluación del conjunto de datos de referencia de la Iniciativa de Neuroimagen de la Enfermedad de Alzheimer (ADNI) muestra una precisión del 81.25% para EA/DCL y EA/DCL en los datos de prueba de RM, así como un 93.75% para EA/DCL y EA/DCL en los datos de prueba de PET. El modelo propuesto tuvo un mejor rendimiento que los estudios existentes cuando se probó en datos de PET con una precisión del 93.75%.
Descripción
La enfermedad de Alzheimer (EA) se ha convertido en un grave peligro para la salud humana en los últimos años, y el cribado y diagnóstico adecuados de la EA siguen siendo un desafío. La entrada multimodal de neuroimagen puede ayudar a identificar la EA en las etapas tempranas de deterioro cognitivo leve (DCL) y en las etapas tardías de DCL a partir del desarrollo cognitivo normal utilizando resonancia magnética (RM) y tomografía por emisión de positrones (PET). La RM proporciona información útil sobre las anormalidades estructurales del cerebro, mientras que los datos PET proporcionan la diferencia entre los cambios fisiológicos y patológicos en la anatomía cerebral. La precisión del diagnóstico de la EA puede aumentar cuando se combinan estos datos. Sin embargo, son heterogéneos y apropiados, y se requiere un número adecuado de características para la clasificación de la EA. Este artículo propone un enfoque de fusión multimodal que utiliza una técnica matemática llamada transformada discreta de ondícula (DWT) para analizar los datos, y la optimización de esta técnica se logra mediante el aprendizaje por transferencia utilizando una red neuronal preentrenada llamada VGG16. La imagen fusionada final se reconstruye utilizando la transformada discreta inversa de ondícula (IDWT). Las imágenes fusionadas se clasifican utilizando un transformador de visión preentrenado. La evaluación del conjunto de datos de referencia de la Iniciativa de Neuroimagen de la Enfermedad de Alzheimer (ADNI) muestra una precisión del 81.25% para EA/DCL y EA/DCL en los datos de prueba de RM, así como un 93.75% para EA/DCL y EA/DCL en los datos de prueba de PET. El modelo propuesto tuvo un mejor rendimiento que los estudios existentes cuando se probó en datos de PET con una precisión del 93.75%.