Clasificación de Cáncer de Piel Multiclase Utilizando Redes de Transformadores de Visión y Modelos Preentrenados Basados en Redes Neuronales Convolucionales
Autores: Arshed, Muhammad Asad; Mumtaz, Shahzad; Ibrahim, Muhammad; Ahmed, Saeed; Tahir, Muhammad; Shafi, Muhammad
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Clasificación de Cáncer de Piel Multiclase Utilizando Redes de Transformadores de Visión y Modelos Preentrenados Basados en Redes Neuronales Convolucionales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Cáncer de piel
Melanoma
Lesiones cutáneas
Redes neuronales convolucionales
Vision Transformer
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El cáncer de piel, particularmente el melanoma, ha sido reconocido como una de las formas más letales de cáncer. Detectar y diagnosticar lesiones cutáneas con precisión puede ser un desafío debido a las notables similitudes entre los diversos tipos de lesiones cutáneas, como el melanoma y los nevos, especialmente al examinar las imágenes en color de la piel. Sin embargo, el diagnóstico temprano juega un papel crucial en la salvación de vidas y en la reducción de la carga sobre los recursos médicos. En consecuencia, el desarrollo de un sistema autónomo robusto para la clasificación del cáncer de piel se vuelve imperativo. Las redes neuronales convolucionales (CNN) se han empleado ampliamente en la última década para automatizar el diagnóstico del cáncer. No obstante, la aparición del Vision Transformer (ViT) ha ganado recientemente un nivel considerable de popularidad en el campo y ha surgido como una alternativa competitiva a las CNN. A la luz de esto, el presente estudio propuso un método alternativo basado en el ViT estándar para identificar diversas enfermedades del cáncer de piel. Para evaluar su rendimiento, el método propuesto se comparó con 11 métodos de transferencia de aprendizaje basados en CNN que se ha demostrado que superan a otras técnicas de aprendizaje profundo que están actualmente en uso. Además, este estudio aborda el problema del desequilibrio de clases dentro del conjunto de datos, un desafío común en la clasificación del cáncer de piel. Al abordar esta preocupación, el estudio propuesto aprovecha el transformer de visión y los modelos de transferencia de aprendizaje basados en CNN para clasificar siete tipos distintos de cáncer de piel. A través de nuestra investigación, hemos encontrado que el uso de transformers de visión preentrenados logró una precisión impresionante del 92.14%, superando a los modelos de transferencia de aprendizaje basados en CNN en varias métricas de evaluación para el diagnóstico del cáncer de piel.
Descripción
El cáncer de piel, particularmente el melanoma, ha sido reconocido como una de las formas más letales de cáncer. Detectar y diagnosticar lesiones cutáneas con precisión puede ser un desafío debido a las notables similitudes entre los diversos tipos de lesiones cutáneas, como el melanoma y los nevos, especialmente al examinar las imágenes en color de la piel. Sin embargo, el diagnóstico temprano juega un papel crucial en la salvación de vidas y en la reducción de la carga sobre los recursos médicos. En consecuencia, el desarrollo de un sistema autónomo robusto para la clasificación del cáncer de piel se vuelve imperativo. Las redes neuronales convolucionales (CNN) se han empleado ampliamente en la última década para automatizar el diagnóstico del cáncer. No obstante, la aparición del Vision Transformer (ViT) ha ganado recientemente un nivel considerable de popularidad en el campo y ha surgido como una alternativa competitiva a las CNN. A la luz de esto, el presente estudio propuso un método alternativo basado en el ViT estándar para identificar diversas enfermedades del cáncer de piel. Para evaluar su rendimiento, el método propuesto se comparó con 11 métodos de transferencia de aprendizaje basados en CNN que se ha demostrado que superan a otras técnicas de aprendizaje profundo que están actualmente en uso. Además, este estudio aborda el problema del desequilibrio de clases dentro del conjunto de datos, un desafío común en la clasificación del cáncer de piel. Al abordar esta preocupación, el estudio propuesto aprovecha el transformer de visión y los modelos de transferencia de aprendizaje basados en CNN para clasificar siete tipos distintos de cáncer de piel. A través de nuestra investigación, hemos encontrado que el uso de transformers de visión preentrenados logró una precisión impresionante del 92.14%, superando a los modelos de transferencia de aprendizaje basados en CNN en varias métricas de evaluación para el diagnóstico del cáncer de piel.