logo móvil
Contáctanos

Sistemas de detección de COVID-19 utilizando algoritmos de aprendizaje profundo basados en datos de voz e imagen

Autores: Nassif, Ali Bou; Shahin, Ismail; Bader, Mohamed; Hassan, Abdelfatah; Werghi, Naoufel

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Sistemas de detección de COVID-19 utilizando algoritmos de aprendizaje profundo basados en datos de voz e imagen


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Epidemia
COVID-19
Salud
Inteligencia artificial
Discurso
Imagen

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones


Descripción
La epidemia global causada por COVID-19 ha tenido un impacto severo en la salud de los seres humanos. El virus ha causado estragos en todo el mundo desde su declaración como pandemia mundial y ha afectado a un número cada vez mayor de naciones en numerosos países de todo el mundo. Recientemente, se ha realizado una cantidad sustancial de trabajo por parte de médicos, científicos y muchos otros que trabajan en primera línea para combatir los efectos del virus en expansión. La integración de la inteligencia artificial, específicamente aplicaciones de aprendizaje profundo y de máquina, en el sector de la salud ha contribuido sustancialmente a la lucha contra COVID-19 al proporcionar un enfoque innovador moderno para detectar, diagnosticar, tratar y prevenir el virus. En este trabajo propuesto, nos enfocamos principalmente en el papel de la señal de voz y/o procesamiento de imágenes en la detección de la presencia de COVID-19. Se han realizado tres tipos de experimentos, utilizando modelos basados en voz, basados en imagen y basados en voz e imagen. Se ha utilizado la memoria a corto plazo (LSTM) para la clasificación de la voz del paciente, la tos y la respiración, obteniendo una precisión que supera el 98%. Además, se han comparado los modelos CNN VGG16, VGG19, Densnet201, ResNet50, Inceptionv3, InceptionResNetV2 y Xception para la clasificación de imágenes de radiografías de tórax. El modelo VGG16 supera a todos los demás modelos de CNN, logrando una precisión del 85.25% sin ajuste fino y del 89.64% después de realizar técnicas de ajuste fino. Además, el modelo basado en voz e imagen ha sido evaluado utilizando los mismos siete modelos, logrando una precisión del 82.22% con el modelo InceptionResNetV2. En consecuencia, no es necesario que se emplee el modelo combinado basado en voz e imagen para fines de diagnóstico, ya que los modelos basados en voz e imagen han mostrado cada uno términos de precisión más altos que el modelo combinado.

Otros recursos que podrían interesarte

Temas Virtualpro