Aprendizaje Profundo Interpretable para la Detección de Neumonía Usando Imágenes de Rayos X de Tórax
Autores: Colin, Jovito; Surantha, Nico
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Aprendizaje Profundo Interpretable para la Detección de Neumonía Usando Imágenes de Rayos X de Tórax
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Neumonía
Modelos de aprendizaje profundo
Técnicas de interpretabilidad
Propagación de Relevancia por Capas
Entrenamiento Adversarial
Mapas de Activación de Clases
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La neumonía sigue siendo un problema de salud global, creando la necesidad de métodos de detección precisos para un tratamiento efectivo. Los modelos de aprendizaje profundo como ResNet50 muestran promesas en la detección de neumonía a partir de radiografías de tórax; sin embargo, su naturaleza de caja negra limita la transparencia, lo que no cumple con lo necesario para la confianza clínica. Este estudio tiene como objetivo mejorar la interpretabilidad del modelo comparando cuatro técnicas de interpretabilidad, que son la Propagación de Relevancia por Capas (LRP), el Entrenamiento Adversarial, los Mapas de Activación de Clase (CAMs) y el Mecanismo de Atención Espacial, y determinando cuál se adapta mejor al modelo, mejorando su transparencia con un impacto mínimo en su rendimiento. Cada técnica fue evaluada por su impacto en la precisión, sensibilidad, especificidad, AUC-ROC, Puntuación Media de Relevancia (MRS) y una puntuación de compensación calculada que equilibra la interpretabilidad y el rendimiento. Los resultados indican que LRP fue la más efectiva en mejorar la interpretabilidad, logrando altas puntuaciones en todas las métricas sin sacrificar la precisión diagnóstica. El modelo alcanzó una precisión de 0.91 y una interpretabilidad de 0.85 (MRS), demostrando su potencial para la integración clínica. En contraste, el Entrenamiento Adversarial, los CAMs y el Mecanismo de Atención Espacial mostraron compensaciones entre interpretabilidad y rendimiento, cada uno destacando características únicas de la imagen pero con cierto impacto en la especificidad y precisión.
Descripción
La neumonía sigue siendo un problema de salud global, creando la necesidad de métodos de detección precisos para un tratamiento efectivo. Los modelos de aprendizaje profundo como ResNet50 muestran promesas en la detección de neumonía a partir de radiografías de tórax; sin embargo, su naturaleza de caja negra limita la transparencia, lo que no cumple con lo necesario para la confianza clínica. Este estudio tiene como objetivo mejorar la interpretabilidad del modelo comparando cuatro técnicas de interpretabilidad, que son la Propagación de Relevancia por Capas (LRP), el Entrenamiento Adversarial, los Mapas de Activación de Clase (CAMs) y el Mecanismo de Atención Espacial, y determinando cuál se adapta mejor al modelo, mejorando su transparencia con un impacto mínimo en su rendimiento. Cada técnica fue evaluada por su impacto en la precisión, sensibilidad, especificidad, AUC-ROC, Puntuación Media de Relevancia (MRS) y una puntuación de compensación calculada que equilibra la interpretabilidad y el rendimiento. Los resultados indican que LRP fue la más efectiva en mejorar la interpretabilidad, logrando altas puntuaciones en todas las métricas sin sacrificar la precisión diagnóstica. El modelo alcanzó una precisión de 0.91 y una interpretabilidad de 0.85 (MRS), demostrando su potencial para la integración clínica. En contraste, el Entrenamiento Adversarial, los CAMs y el Mecanismo de Atención Espacial mostraron compensaciones entre interpretabilidad y rendimiento, cada uno destacando características únicas de la imagen pero con cierto impacto en la especificidad y precisión.