Detección de la retinopatía diabética en imágenes de fondo de ojo mediante modelos de clasificación de CNN
Autores: Asia, Al-Omaisi; Zhu, Cheng-Zhang; Althubiti, Sara A.; Al-Alimi, Dalal; Xiao, Ya-Long; Ouyang, Ping-Bo; Al-Qaness, Mohammed A. A.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Detección de la retinopatía diabética en imágenes de fondo de ojo mediante modelos de clasificación de CNN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Diabetes
Retinopatía diabética
Complicaciones microvasculares
Aprendizaje profundo
Red neuronal convolucional
ResNet-101
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La diabetes es una enfermedad generalizada en el mundo y puede llevar a la retinopatía diabética, edema macular y otras complicaciones microvasculares evidentes en la retina del ojo humano. Este estudio intenta detectar la retinopatía diabética (RD), que ha sido la principal causa de ceguera en las personas en la última década. El tratamiento oportuno o temprano es necesario para prevenir algunas complicaciones de la RD y controlar la glucosa en sangre. La detección de la RD es muy difícil en un diagnóstico manual que consume mucho tiempo debido a su diversidad y complejidad. Este trabajo utiliza una aplicación de aprendizaje profundo, una red neuronal convolucional (CNN), en fotografías de fondo de ojo para distinguir las etapas de la RD. El conjunto de imágenes en este estudio se obtiene del Hospital de Oftalmología Xiangya N.º 2 (XHO), Changsha, China, que es muy grande, pequeño y las etiquetas están desequilibradas. Por lo tanto, este estudio resuelve primero el problema del conjunto de datos existente proponiendo un método que utiliza pasos de preprocesamiento, regularización y aumento para aumentar y preparar el conjunto de imágenes de XHO para el entrenamiento y mejorar el rendimiento. Luego, aprovecha las ventajas del poder de la CNN con diferentes estructuras de red neuronal residual (ResNet), a saber, ResNet-101, ResNet-50 y VggNet-16, para detectar RD en los conjuntos de datos de XHO. ResNet-101 logró el máximo nivel de precisión, 0.9888, con una pérdida de entrenamiento de 0.3499 y una pérdida de prueba de 0.9882. Luego, ResNet-101 se evalúa en 1787 fotos de las bases de datos HRF, STARE, DIARETDB0 y XHO, logrando una precisión promedio de 0.97, que es mayor que los esfuerzos anteriores. Los resultados prueban que el modelo de CNN (ResNet-101) tiene una mejor precisión que ResNet-50 y VggNet-16 en la clasificación de imágenes de RD.
Descripción
La diabetes es una enfermedad generalizada en el mundo y puede llevar a la retinopatía diabética, edema macular y otras complicaciones microvasculares evidentes en la retina del ojo humano. Este estudio intenta detectar la retinopatía diabética (RD), que ha sido la principal causa de ceguera en las personas en la última década. El tratamiento oportuno o temprano es necesario para prevenir algunas complicaciones de la RD y controlar la glucosa en sangre. La detección de la RD es muy difícil en un diagnóstico manual que consume mucho tiempo debido a su diversidad y complejidad. Este trabajo utiliza una aplicación de aprendizaje profundo, una red neuronal convolucional (CNN), en fotografías de fondo de ojo para distinguir las etapas de la RD. El conjunto de imágenes en este estudio se obtiene del Hospital de Oftalmología Xiangya N.º 2 (XHO), Changsha, China, que es muy grande, pequeño y las etiquetas están desequilibradas. Por lo tanto, este estudio resuelve primero el problema del conjunto de datos existente proponiendo un método que utiliza pasos de preprocesamiento, regularización y aumento para aumentar y preparar el conjunto de imágenes de XHO para el entrenamiento y mejorar el rendimiento. Luego, aprovecha las ventajas del poder de la CNN con diferentes estructuras de red neuronal residual (ResNet), a saber, ResNet-101, ResNet-50 y VggNet-16, para detectar RD en los conjuntos de datos de XHO. ResNet-101 logró el máximo nivel de precisión, 0.9888, con una pérdida de entrenamiento de 0.3499 y una pérdida de prueba de 0.9882. Luego, ResNet-101 se evalúa en 1787 fotos de las bases de datos HRF, STARE, DIARETDB0 y XHO, logrando una precisión promedio de 0.97, que es mayor que los esfuerzos anteriores. Los resultados prueban que el modelo de CNN (ResNet-101) tiene una mejor precisión que ResNet-50 y VggNet-16 en la clasificación de imágenes de RD.