Un modelo de diagnóstico de enfermedades respiratorias habilitado para inteligencia artificial y libre de prejuicios utilizando audio de tos
Autores: Saeed, Tabish; Ijaz, Aneeqa; Sadiq, Ismail; Qureshi, Haneya Naeem; Rizwan, Ali; Imran, Ali
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo de diagnóstico de enfermedades respiratorias habilitado para inteligencia artificial y libre de prejuicios utilizando audio de tos
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Enfermedades respiratorias
Inteligencia artificial
Red Libre de Sesgo
Conjunto de datos COVID-19
Redes Neuronales Convolucionales
Memoria a Corto y Largo Plazo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
El diagnóstico basado en la tos para enfermedades respiratorias (RDs) utilizando inteligencia artificial (IA) ha atraído considerable atención, sin embargo, muchos estudios existentes pasan por alto variables de confusión en sus modelos predictivos. Estas variables pueden distorsionar la relación entre las grabaciones de tos (datos de entrada) y el estado de RD (variable de salida), lo que lleva a asociaciones sesgadas y un rendimiento de modelo irrealista. Para abordar esta brecha, proponemos la Red Libre de Sesgos (RBF-Net), una solución de extremo a extremo que mitiga de manera efectiva el impacto de los factores de confusión en la distribución de datos de entrenamiento. RBF-Net garantiza características de diagnóstico de RD precisas e imparciales, enfatizando su relevancia al incorporar un conjunto de datos de COVID-19 en este estudio. Este enfoque tiene como objetivo mejorar la fiabilidad de los modelos de diagnóstico de RD basados en IA al enfrentar los desafíos planteados por variables de confusión. Se propone una combinación de Redes Neuronales Convolucionales (CNN) y Redes de Memoria a Corto y Largo Plazo (LSTM) para el módulo codificador de características de RBF-Net. Se incorpora un predictor de sesgo adicional en el esquema de clasificación para formular una Red Generativa Antagónica Condicional (c-GAN) que ayuda a decorrelacionar el impacto de las variables de confusión de la predicción de RD. El mérito de RBF-Net se demuestra comparando el rendimiento de clasificación con un modelo de Aprendizaje Profundo (DL) de Estado del Arte (SoTA) (CNN-LSTM) después de entrenar en diferentes conjuntos de datos desequilibrados de COVID-19, creados utilizando un conjunto de datos de tos de escala propietaria a gran escala. RBF-Net demostró su robustez contra escenarios de entrenamiento extremadamente sesgados al lograr precisión en el conjunto de pruebas del 84.1%, 84.6% y 80.5% para las siguientes variables de confusión-género, edad y estado de fumador, respectivamente. RBF-Net supera las precisiones del conjunto de pruebas del modelo CNN-LSTM en un 5.5%, 7.7% y 8.2%, respectivamente.
Descripción
El diagnóstico basado en la tos para enfermedades respiratorias (RDs) utilizando inteligencia artificial (IA) ha atraído considerable atención, sin embargo, muchos estudios existentes pasan por alto variables de confusión en sus modelos predictivos. Estas variables pueden distorsionar la relación entre las grabaciones de tos (datos de entrada) y el estado de RD (variable de salida), lo que lleva a asociaciones sesgadas y un rendimiento de modelo irrealista. Para abordar esta brecha, proponemos la Red Libre de Sesgos (RBF-Net), una solución de extremo a extremo que mitiga de manera efectiva el impacto de los factores de confusión en la distribución de datos de entrenamiento. RBF-Net garantiza características de diagnóstico de RD precisas e imparciales, enfatizando su relevancia al incorporar un conjunto de datos de COVID-19 en este estudio. Este enfoque tiene como objetivo mejorar la fiabilidad de los modelos de diagnóstico de RD basados en IA al enfrentar los desafíos planteados por variables de confusión. Se propone una combinación de Redes Neuronales Convolucionales (CNN) y Redes de Memoria a Corto y Largo Plazo (LSTM) para el módulo codificador de características de RBF-Net. Se incorpora un predictor de sesgo adicional en el esquema de clasificación para formular una Red Generativa Antagónica Condicional (c-GAN) que ayuda a decorrelacionar el impacto de las variables de confusión de la predicción de RD. El mérito de RBF-Net se demuestra comparando el rendimiento de clasificación con un modelo de Aprendizaje Profundo (DL) de Estado del Arte (SoTA) (CNN-LSTM) después de entrenar en diferentes conjuntos de datos desequilibrados de COVID-19, creados utilizando un conjunto de datos de tos de escala propietaria a gran escala. RBF-Net demostró su robustez contra escenarios de entrenamiento extremadamente sesgados al lograr precisión en el conjunto de pruebas del 84.1%, 84.6% y 80.5% para las siguientes variables de confusión-género, edad y estado de fumador, respectivamente. RBF-Net supera las precisiones del conjunto de pruebas del modelo CNN-LSTM en un 5.5%, 7.7% y 8.2%, respectivamente.