logo móvil
Contáctanos

Mejora de ResNet50 para la clasificación de retinopatía diabética: atención externa y rama residual modificada

Autores: Feng, Menglong; Cai, Yixuan; Yan, Shen

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Mejora de ResNet50 para la clasificación de retinopatía diabética: atención externa y rama residual modificada


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Retinopatía diabética
Modelos de aprendizaje profundo
Modelo ResNet50
Mecanismo de atención
Convolución multiescala
Preprocesamiento de imágenes

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 23

Citaciones: Sin citaciones


Descripción
Una de las complicaciones microvasculares comunes en pacientes diabéticos es la retinopatía diabética (RD), que afecta principalmente a los vasos sanguíneos de la retina. A medida que avanza la diabetes, la incidencia de la RD aumenta gradualmente y, en situaciones graves, puede causar pérdida de visión e incluso ceguera. Diagnosticar la RD tempranamente es esencial para mitigar sus consecuencias, y los modelos de aprendizaje profundo proporcionan un enfoque efectivo. En este estudio, proponemos un modelo ResNet50 mejorado, que reemplaza la convolución 3 x 3 en la estructura residual al introducir un mecanismo de atención externo, que mejora la conciencia del modelo sobre la información global y le permite entender más a fondo las características de los datos de entrada. Además, se añade una convolución multiescala al brazo residual, lo que mejora aún más la capacidad del modelo para extraer características locales y globales, y mejora la precisión en el procesamiento de los detalles de la imagen. Asimismo, se introduce el optimizador Sophia para reemplazar al tradicional optimizador Adam, lo que optimiza aún más el rendimiento de clasificación del modelo. En este estudio, se utilizaron 3662 imágenes del conjunto de datos abierto de Kaggle para generar 20,184 imágenes para el entrenamiento del modelo después de preprocesamiento de imágenes y aumento de datos. Los resultados experimentales muestran que el modelo ResNet50 mejorado logra una precisión de clasificación del 96.68% en el conjunto de validación, lo que es un 4.36% más alto que la arquitectura original, y el valor Kappa se incrementa en un 5.45%. Estas mejoras contribuyen al diagnóstico temprano de la RD y disminuyen la probabilidad de ceguera en los pacientes.

Otros recursos que podrían interesarte

Temas Virtualpro