Clasificación de COVID-19 a través de modelos de aprendizaje profundo con imágenes de TC en escala de grises de tres canales
Autores: Sufian, Maisarah Mohd; Moung, Ervin Gubin; Hijazi, Mohd Hanafi Ahmad; Yahya, Farashazillah; Dargham, Jamal Ahmad; Farzamnia, Ali; Sia, Florence; Mohd Naim, Nur Faraha
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Clasificación de COVID-19 a través de modelos de aprendizaje profundo con imágenes de TC en escala de grises de tres canales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Covid-19
Ct
Transfer learning
Imágenes en escala de grises
Modelos pre-entrenados
Ecualización de histograma
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
COVID-19, una enfermedad infecciosa causada por el coronavirus, ha desencadenado una pandemia que ha cobrado muchas vidas. Los institutos clínicos han considerado durante mucho tiempo la tomografía computarizada (TC) como un excelente y complementario método de detección para la reacción en cadena de la polimerasa con transcriptasa inversa (RT-PCR). Debido al conjunto de datos limitado disponible sobre COVID-19, los modelos basados en transfer learning se han convertido en las soluciones más utilizadas para la detección automática de COVID-19. Sin embargo, las imágenes de TC suelen proporcionarse en escala de grises, lo que plantea un desafío para la detección automática utilizando modelos pre-entrenados, que anteriormente se entrenaron en imágenes RGB. Se han propuesto varios métodos en la literatura para convertir imágenes en escala de grises a imágenes RGB (de tres canales) para su uso con modelos de aprendizaje profundo pre-entrenados, como la pseudo-colorización, la replicación y la colorización. El método más común es la replicación, donde la imagen en escala de grises de un canal se repite en la imagen de tres canales. Aunque esta técnica es simple, no proporciona nueva información y puede llevar a un bajo rendimiento debido a características de imagen redundantes alimentadas en el modelo de aprendizaje profundo. Este estudio propone un nuevo método de pre-procesamiento de imágenes para imágenes médicas en escala de grises que utilizan Ecualización del Histograma (HE) y Ecualización del Histograma Adaptativo Limitado por Contraste (CLAHE) para crear una representación de imagen de tres canales que proporciona información diferente en cada canal. La efectividad de este método se evalúa utilizando otros seis modelos pre-entrenados, incluyendo InceptionV3, MobileNet, ResNet50, VGG16, ViT-B16 y ViT-B32. Los resultados muestran que la representación de imagen propuesta mejora significativamente el rendimiento de clasificación de los modelos, con el modelo InceptionV3 logrando una precisión del 99.60% y una sensibilidad (también conocida como recall) del 99.59%. El método propuesto aborda la limitación de utilizar imágenes médicas en escala de grises para la detección de COVID-19 y puede potencialmente mejorar la detección temprana y el control de la enfermedad. Además, el método propuesto se puede aplicar a otras tareas de imágenes médicas con una entrada de imagen en escala de grises, convirtiéndolo así en una solución generalizable.
Descripción
COVID-19, una enfermedad infecciosa causada por el coronavirus, ha desencadenado una pandemia que ha cobrado muchas vidas. Los institutos clínicos han considerado durante mucho tiempo la tomografía computarizada (TC) como un excelente y complementario método de detección para la reacción en cadena de la polimerasa con transcriptasa inversa (RT-PCR). Debido al conjunto de datos limitado disponible sobre COVID-19, los modelos basados en transfer learning se han convertido en las soluciones más utilizadas para la detección automática de COVID-19. Sin embargo, las imágenes de TC suelen proporcionarse en escala de grises, lo que plantea un desafío para la detección automática utilizando modelos pre-entrenados, que anteriormente se entrenaron en imágenes RGB. Se han propuesto varios métodos en la literatura para convertir imágenes en escala de grises a imágenes RGB (de tres canales) para su uso con modelos de aprendizaje profundo pre-entrenados, como la pseudo-colorización, la replicación y la colorización. El método más común es la replicación, donde la imagen en escala de grises de un canal se repite en la imagen de tres canales. Aunque esta técnica es simple, no proporciona nueva información y puede llevar a un bajo rendimiento debido a características de imagen redundantes alimentadas en el modelo de aprendizaje profundo. Este estudio propone un nuevo método de pre-procesamiento de imágenes para imágenes médicas en escala de grises que utilizan Ecualización del Histograma (HE) y Ecualización del Histograma Adaptativo Limitado por Contraste (CLAHE) para crear una representación de imagen de tres canales que proporciona información diferente en cada canal. La efectividad de este método se evalúa utilizando otros seis modelos pre-entrenados, incluyendo InceptionV3, MobileNet, ResNet50, VGG16, ViT-B16 y ViT-B32. Los resultados muestran que la representación de imagen propuesta mejora significativamente el rendimiento de clasificación de los modelos, con el modelo InceptionV3 logrando una precisión del 99.60% y una sensibilidad (también conocida como recall) del 99.59%. El método propuesto aborda la limitación de utilizar imágenes médicas en escala de grises para la detección de COVID-19 y puede potencialmente mejorar la detección temprana y el control de la enfermedad. Además, el método propuesto se puede aplicar a otras tareas de imágenes médicas con una entrada de imagen en escala de grises, convirtiéndolo así en una solución generalizable.