Mejora de ResNet50 para la clasificación de retinopatía diabética: atención externa y rama residual modificada
Autores: Feng, Menglong; Cai, Yixuan; Yan, Shen
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Mejora de ResNet50 para la clasificación de retinopatía diabética: atención externa y rama residual modificada
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Retinopatía diabética
Modelos de aprendizaje profundo
Modelo ResNet50
Mecanismo de atención
Convolución multiescala
Preprocesamiento de imágenes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Una de las complicaciones microvasculares comunes en pacientes diabéticos es la retinopatía diabética (RD), que afecta principalmente a los vasos sanguíneos de la retina. A medida que avanza la diabetes, la incidencia de la RD aumenta gradualmente y, en situaciones graves, puede causar pérdida de visión e incluso ceguera. Diagnosticar la RD tempranamente es esencial para mitigar sus consecuencias, y los modelos de aprendizaje profundo proporcionan un enfoque efectivo. En este estudio, proponemos un modelo ResNet50 mejorado, que reemplaza la convolución 3 x 3 en la estructura residual al introducir un mecanismo de atención externo, que mejora la conciencia del modelo sobre la información global y le permite entender más a fondo las características de los datos de entrada. Además, se añade una convolución multiescala al brazo residual, lo que mejora aún más la capacidad del modelo para extraer características locales y globales, y mejora la precisión en el procesamiento de los detalles de la imagen. Asimismo, se introduce el optimizador Sophia para reemplazar al tradicional optimizador Adam, lo que optimiza aún más el rendimiento de clasificación del modelo. En este estudio, se utilizaron 3662 imágenes del conjunto de datos abierto de Kaggle para generar 20,184 imágenes para el entrenamiento del modelo después de preprocesamiento de imágenes y aumento de datos. Los resultados experimentales muestran que el modelo ResNet50 mejorado logra una precisión de clasificación del 96.68% en el conjunto de validación, lo que es un 4.36% más alto que la arquitectura original, y el valor Kappa se incrementa en un 5.45%. Estas mejoras contribuyen al diagnóstico temprano de la RD y disminuyen la probabilidad de ceguera en los pacientes.
Descripción
Una de las complicaciones microvasculares comunes en pacientes diabéticos es la retinopatía diabética (RD), que afecta principalmente a los vasos sanguíneos de la retina. A medida que avanza la diabetes, la incidencia de la RD aumenta gradualmente y, en situaciones graves, puede causar pérdida de visión e incluso ceguera. Diagnosticar la RD tempranamente es esencial para mitigar sus consecuencias, y los modelos de aprendizaje profundo proporcionan un enfoque efectivo. En este estudio, proponemos un modelo ResNet50 mejorado, que reemplaza la convolución 3 x 3 en la estructura residual al introducir un mecanismo de atención externo, que mejora la conciencia del modelo sobre la información global y le permite entender más a fondo las características de los datos de entrada. Además, se añade una convolución multiescala al brazo residual, lo que mejora aún más la capacidad del modelo para extraer características locales y globales, y mejora la precisión en el procesamiento de los detalles de la imagen. Asimismo, se introduce el optimizador Sophia para reemplazar al tradicional optimizador Adam, lo que optimiza aún más el rendimiento de clasificación del modelo. En este estudio, se utilizaron 3662 imágenes del conjunto de datos abierto de Kaggle para generar 20,184 imágenes para el entrenamiento del modelo después de preprocesamiento de imágenes y aumento de datos. Los resultados experimentales muestran que el modelo ResNet50 mejorado logra una precisión de clasificación del 96.68% en el conjunto de validación, lo que es un 4.36% más alto que la arquitectura original, y el valor Kappa se incrementa en un 5.45%. Estas mejoras contribuyen al diagnóstico temprano de la RD y disminuyen la probabilidad de ceguera en los pacientes.