Mejorando la Detección Temprana de la Enfermedad de Alzheimer a través de la Arquitectura de Aprendizaje Automático Vision Transformer Utilizando Imágenes de MRI
Autores: Hechkel, Wided; Leo, Marco; Carcagnì, Pierluigi; Del-Coco, Marco; Helali, Abdelhamid
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Mejorando la Detección Temprana de la Enfermedad de Alzheimer a través de la Arquitectura de Aprendizaje Automático Vision Transformer Utilizando Imágenes de MRI
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Diagnóstico asistido por computadora
Aprendizaje profundo
Enfermedad de Alzheimer
Imágenes por Resonancia Magnética
Transformador de Visión
Clasificación multiclase
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los sistemas de diagnóstico asistido por computadora (CAD) basados en aprendizaje profundo han mostrado un potencial significativo para la clasificación de etapas de la enfermedad de Alzheimer (EA) a partir de imágenes de resonancia magnética (IRM). Sin embargo, desafíos como el desequilibrio de clases, tamaños de muestra pequeños y la presencia de múltiples cortes por sujeto pueden llevar a una evaluación sesgada y a un rendimiento estadísticamente poco fiable, particularmente para las clases minoritarias. En este estudio, se propone un marco basado en Vision Transformer (ViT) para la clasificación multi-clase de EA utilizando un conjunto de datos de Kaggle que contiene 6400 cortes de IRM a través de cuatro etapas cognitivas. Se emplea una estrategia de división de datos por sujeto para prevenir la fuga de información entre los conjuntos de entrenamiento y prueba, y se examina críticamente la falta de fiabilidad estadística de las puntuaciones casi perfectas en clases subrepresentadas. Se realiza un estudio de ablación para evaluar la contribución de componentes arquitectónicos clave, demostrando la efectividad de la autoatención y la incrustación de parches en la captura de características discriminativas. Además, se incorporan mapas de visualización basados en atención para resaltar las regiones del cerebro que influyen en las decisiones del modelo y para ilustrar diferencias anatómicas sutiles entre los casos de Demencia Leve y Demencia Muy Leve. El enfoque propuesto logra una precisión de prueba del 97.98%, superando los métodos existentes en el mismo conjunto de datos mientras proporciona una mejor interpretabilidad. Apoya la identificación temprana y precisa de la etapa de EA.
Descripción
Los sistemas de diagnóstico asistido por computadora (CAD) basados en aprendizaje profundo han mostrado un potencial significativo para la clasificación de etapas de la enfermedad de Alzheimer (EA) a partir de imágenes de resonancia magnética (IRM). Sin embargo, desafíos como el desequilibrio de clases, tamaños de muestra pequeños y la presencia de múltiples cortes por sujeto pueden llevar a una evaluación sesgada y a un rendimiento estadísticamente poco fiable, particularmente para las clases minoritarias. En este estudio, se propone un marco basado en Vision Transformer (ViT) para la clasificación multi-clase de EA utilizando un conjunto de datos de Kaggle que contiene 6400 cortes de IRM a través de cuatro etapas cognitivas. Se emplea una estrategia de división de datos por sujeto para prevenir la fuga de información entre los conjuntos de entrenamiento y prueba, y se examina críticamente la falta de fiabilidad estadística de las puntuaciones casi perfectas en clases subrepresentadas. Se realiza un estudio de ablación para evaluar la contribución de componentes arquitectónicos clave, demostrando la efectividad de la autoatención y la incrustación de parches en la captura de características discriminativas. Además, se incorporan mapas de visualización basados en atención para resaltar las regiones del cerebro que influyen en las decisiones del modelo y para ilustrar diferencias anatómicas sutiles entre los casos de Demencia Leve y Demencia Muy Leve. El enfoque propuesto logra una precisión de prueba del 97.98%, superando los métodos existentes en el mismo conjunto de datos mientras proporciona una mejor interpretabilidad. Apoya la identificación temprana y precisa de la etapa de EA.