Multi-scale feature fusion con ponderación adaptativa para la clasificación de la gravedad de la retinopatía diabética
Autores: Fan, Runze; Liu, Yuhong; Zhang, Rongfen
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Multi-scale feature fusion con ponderación adaptativa para la clasificación de la gravedad de la retinopatía diabética
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Retinopatía diabética
Automatización
Diagnóstico
Detección del nivel de gravedad
MobileNetV3
Rendimiento de clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 51
Citaciones: Sin citaciones
La retinopatía diabética (RD) es la principal causa de ceguera en personas que padecen diabetes. La automatización del diagnóstico de la RD podría ayudar a muchos pacientes a evitar el riesgo de ceguera al identificar la enfermedad y realizar juicios en una etapa temprana. El enfoque principal del trabajo actual es proponer un esquema factible de detección del nivel de gravedad de la RD bajo la red de base MobileNetV3 basada en una característica multiescala de la imagen de fondo de ojo y mejorar el rendimiento de clasificación del modelo. En primer lugar, se diseñó un módulo de atención residual especial RCAM para la extracción de características multiescala de diferentes capas de convolución. Luego, se llevó a cabo la fusión de características mediante una operación innovadora de ponderación adaptativa en cada capa. El peso correspondiente del bloque de convolución se actualiza automáticamente en el entrenamiento del modelo, con un posterior proceso de promediado global (GAP) y división para evitar el sobreajuste del modelo y eliminar características no críticas. Además, se utiliza la Pérdida Focal como función de pérdida debido al desequilibrio de datos de imágenes de RD. Los resultados experimentales basados en el conjunto de datos del concurso Kaggle APTOS 2019 muestran que nuestro método propuesto para la clasificación de la gravedad de la RD logra una precisión del 85.32%, una estadística kappa del 77.26% y un AUC de 0.97. Los resultados de comparación también indican que el modelo obtenido es superior a los modelos existentes y presenta un rendimiento de clasificación superior en el conjunto de datos.
Descripción
La retinopatía diabética (RD) es la principal causa de ceguera en personas que padecen diabetes. La automatización del diagnóstico de la RD podría ayudar a muchos pacientes a evitar el riesgo de ceguera al identificar la enfermedad y realizar juicios en una etapa temprana. El enfoque principal del trabajo actual es proponer un esquema factible de detección del nivel de gravedad de la RD bajo la red de base MobileNetV3 basada en una característica multiescala de la imagen de fondo de ojo y mejorar el rendimiento de clasificación del modelo. En primer lugar, se diseñó un módulo de atención residual especial RCAM para la extracción de características multiescala de diferentes capas de convolución. Luego, se llevó a cabo la fusión de características mediante una operación innovadora de ponderación adaptativa en cada capa. El peso correspondiente del bloque de convolución se actualiza automáticamente en el entrenamiento del modelo, con un posterior proceso de promediado global (GAP) y división para evitar el sobreajuste del modelo y eliminar características no críticas. Además, se utiliza la Pérdida Focal como función de pérdida debido al desequilibrio de datos de imágenes de RD. Los resultados experimentales basados en el conjunto de datos del concurso Kaggle APTOS 2019 muestran que nuestro método propuesto para la clasificación de la gravedad de la RD logra una precisión del 85.32%, una estadística kappa del 77.26% y un AUC de 0.97. Los resultados de comparación también indican que el modelo obtenido es superior a los modelos existentes y presenta un rendimiento de clasificación superior en el conjunto de datos.