Selección de características a nivel de parche para la clasificación de enfermedades torácicas mediante imágenes de radiografías de tórax utilizando el cuello de botella de información
Autores: Hung-Nguyen, Manh
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Selección de características a nivel de parche para la clasificación de enfermedades torácicas mediante imágenes de radiografías de tórax utilizando el cuello de botella de información
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Radiografía de tórax
Inteligencia artificial
Apoyo diagnóstico
Cuello de botella de información variacional
Nivel de parche
Redes neuronales convolucionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La radiografía de tórax (CXR) sirve como una prueba clínica ampliamente utilizada en el diagnóstico médico. Muchos estudios han intentado aplicar programas de inteligencia artificial (IA) para analizar imágenes de CXR. A pesar de numerosos resultados positivos, evaluar la aplicabilidad de los modelos de IA para un soporte diagnóstico integral sigue siendo un desafío formidable. Observamos que, incluso cuando los modelos de IA muestran una alta precisión en un conjunto de datos, su rendimiento puede deteriorarse cuando se prueban en otro. Para abordar este problema, proponemos incorporar un cuello de botella de información variacional (VIB) a nivel de parche para mejorar la capacidad de generalización de los modelos de soporte diagnóstico. El VIB introduce un modelo probabilístico destinado a aproximar la distribución posterior de variables latentes dadas los datos de entrada, mejorando así las capacidades de generalización del modelo en datos no vistos. A diferencia de los enfoques VIB convencionales que aplanan las características y utilizan un truco de reparametrización para muestrear una nueva característica latente, nuestro método aplica el truco a mapas de características 2D. Este diseño permite que solo los píxeles importantes respondan, y el modelo seleccionará parches importantes en una imagen. Además, el VIB a nivel de parche propuesto se integra perfectamente con varias redes neuronales convolucionales, ofreciendo una solución versátil para mejorar el rendimiento. Los resultados experimentales ilustran una precisión mejorada en configuraciones de experimentos estándar. Además, el método muestra una mejora robusta al entrenar y probar en diferentes conjuntos de datos.
Descripción
La radiografía de tórax (CXR) sirve como una prueba clínica ampliamente utilizada en el diagnóstico médico. Muchos estudios han intentado aplicar programas de inteligencia artificial (IA) para analizar imágenes de CXR. A pesar de numerosos resultados positivos, evaluar la aplicabilidad de los modelos de IA para un soporte diagnóstico integral sigue siendo un desafío formidable. Observamos que, incluso cuando los modelos de IA muestran una alta precisión en un conjunto de datos, su rendimiento puede deteriorarse cuando se prueban en otro. Para abordar este problema, proponemos incorporar un cuello de botella de información variacional (VIB) a nivel de parche para mejorar la capacidad de generalización de los modelos de soporte diagnóstico. El VIB introduce un modelo probabilístico destinado a aproximar la distribución posterior de variables latentes dadas los datos de entrada, mejorando así las capacidades de generalización del modelo en datos no vistos. A diferencia de los enfoques VIB convencionales que aplanan las características y utilizan un truco de reparametrización para muestrear una nueva característica latente, nuestro método aplica el truco a mapas de características 2D. Este diseño permite que solo los píxeles importantes respondan, y el modelo seleccionará parches importantes en una imagen. Además, el VIB a nivel de parche propuesto se integra perfectamente con varias redes neuronales convolucionales, ofreciendo una solución versátil para mejorar el rendimiento. Los resultados experimentales ilustran una precisión mejorada en configuraciones de experimentos estándar. Además, el método muestra una mejora robusta al entrenar y probar en diferentes conjuntos de datos.