Efecto interactivo de la tasa de aprendizaje y el tamaño del lote para implementar el aprendizaje por transferencia en la clasificación de tumores cerebrales
Autores: Usmani, Irfan Ahmed; Qadri, Muhammad Tahir; Zia, Razia; Alrayes, Fatma S.; Saidani, Oumaima; Dashtipour, Kia
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Efecto interactivo de la tasa de aprendizaje y el tamaño del lote para implementar el aprendizaje por transferencia en la clasificación de tumores cerebrales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tumores cerebrales
Aprendizaje por transferencia
Hiperparámetros
Tasa de aprendizaje
Tamaño de lote
Aprendizaje Profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Para clasificar tumores cerebrales con conjuntos de datos pequeños, el enfoque de aprendizaje por transferencia basado en el conocimiento (KBTL) ha tenido un excelente desempeño en lograr un modelo de clasificación optimizado. Sin embargo, su implementación exitosa suele estar afectada por diferentes hiperparámetros, específicamente la tasa de aprendizaje (LR), el tamaño del lote (BS) y su influencia conjunta. En general, la mayoría de las investigaciones existentes no pudieron lograr el rendimiento deseado porque el trabajo abordaba solo una sintonización de hiperparámetros. Este estudio adoptó un enfoque basado en una matriz de producto cartesiano, para interpretar el efecto de ambos hiperparámetros y su interacción en el rendimiento de los modelos. Para evaluar su impacto, se utilizaron 56 hiperparámetros de dos tuplas de la matriz de producto cartesiano como entradas para realizar un ejercicio extenso, que comprendía 504 simulaciones para tres modelos de aprendizaje profundo (DL) pre-entrenados basados en arquitecturas de vanguardia, ResNet18, ResNet50 y ResNet101. Además, el impacto también fue evaluado utilizando tres optimizadores (solucionadores) bien conocidos: SGDM, Adam y RMSProp. La evaluación del rendimiento mostró que el marco es un marco eficiente para lograr valores óptimos de dos hiperparámetros importantes (LR y BS) y, en consecuencia, un modelo optimizado con una precisión del 99.56%. Además, nuestros resultados mostraron que ambos hiperparámetros tienen un impacto significativo de forma individual e interactiva, con un equilibrio entre ellos. Además, el espacio de evaluación se amplió utilizando el análisis ANOVA estadístico para validar los hallazgos principales. La prueba t devolvió un valor de < 0.05, confirmando que ambos hiperparámetros no solo tienen un impacto significativo en el rendimiento del modelo de forma independiente, sino que existe una interacción entre los hiperparámetros para una combinación de sus niveles.
Descripción
Para clasificar tumores cerebrales con conjuntos de datos pequeños, el enfoque de aprendizaje por transferencia basado en el conocimiento (KBTL) ha tenido un excelente desempeño en lograr un modelo de clasificación optimizado. Sin embargo, su implementación exitosa suele estar afectada por diferentes hiperparámetros, específicamente la tasa de aprendizaje (LR), el tamaño del lote (BS) y su influencia conjunta. En general, la mayoría de las investigaciones existentes no pudieron lograr el rendimiento deseado porque el trabajo abordaba solo una sintonización de hiperparámetros. Este estudio adoptó un enfoque basado en una matriz de producto cartesiano, para interpretar el efecto de ambos hiperparámetros y su interacción en el rendimiento de los modelos. Para evaluar su impacto, se utilizaron 56 hiperparámetros de dos tuplas de la matriz de producto cartesiano como entradas para realizar un ejercicio extenso, que comprendía 504 simulaciones para tres modelos de aprendizaje profundo (DL) pre-entrenados basados en arquitecturas de vanguardia, ResNet18, ResNet50 y ResNet101. Además, el impacto también fue evaluado utilizando tres optimizadores (solucionadores) bien conocidos: SGDM, Adam y RMSProp. La evaluación del rendimiento mostró que el marco es un marco eficiente para lograr valores óptimos de dos hiperparámetros importantes (LR y BS) y, en consecuencia, un modelo optimizado con una precisión del 99.56%. Además, nuestros resultados mostraron que ambos hiperparámetros tienen un impacto significativo de forma individual e interactiva, con un equilibrio entre ellos. Además, el espacio de evaluación se amplió utilizando el análisis ANOVA estadístico para validar los hallazgos principales. La prueba t devolvió un valor de < 0.05, confirmando que ambos hiperparámetros no solo tienen un impacto significativo en el rendimiento del modelo de forma independiente, sino que existe una interacción entre los hiperparámetros para una combinación de sus niveles.