Mejorando la Detección de Lesiones Cutáneas con Arquitecturas Basadas en Transformadores
Autores: Villamarín-Olmos, Andrés; Renza, Diego
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Mejorando la Detección de Lesiones Cutáneas con Arquitecturas Basadas en Transformadores
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Arquitecturas de transformadores
Lesiones cutáneas
Imágenes
Ajuste de hiperparámetros
Estrategia de aumento de datos
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este artículo describe la metodología para ajustar y comparar once variantes de arquitecturas Transformer para la clasificación de lesiones cutáneas utilizando imágenes: cinco variantes del Vision Transformer (ViT) de Google y seis variantes del Swin Transformer de Microsoft. Presentamos la metodología utilizada para lograr estos resultados, que incluye una meticulosa optimización de hiperparámetros y una robusta estrategia de aumento de datos para abordar el problema del desequilibrio de clases. Este enfoque nos permitió superar el estado del arte en el conjunto de datos DermaMNIST con respecto a los modelos basados en CNN, y lograr resultados muy competitivos en el conjunto de datos ISIC Challenge 2019 con respecto a los modelos basados en Transformer. Además, empleamos el método CheferCAM para proporcionar explicaciones visuales que identifican las regiones de imagen más influyentes en las predicciones de los modelos.
Descripción
Este artículo describe la metodología para ajustar y comparar once variantes de arquitecturas Transformer para la clasificación de lesiones cutáneas utilizando imágenes: cinco variantes del Vision Transformer (ViT) de Google y seis variantes del Swin Transformer de Microsoft. Presentamos la metodología utilizada para lograr estos resultados, que incluye una meticulosa optimización de hiperparámetros y una robusta estrategia de aumento de datos para abordar el problema del desequilibrio de clases. Este enfoque nos permitió superar el estado del arte en el conjunto de datos DermaMNIST con respecto a los modelos basados en CNN, y lograr resultados muy competitivos en el conjunto de datos ISIC Challenge 2019 con respecto a los modelos basados en Transformer. Además, empleamos el método CheferCAM para proporcionar explicaciones visuales que identifican las regiones de imagen más influyentes en las predicciones de los modelos.