Validación adversarial impulsada por la complejidad para datos de imágenes médicas corruptos
Autores: Renza, Diego; Brieva, Jorge; Moya-Albor, Ernesto
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Validación adversarial impulsada por la complejidad para datos de imágenes médicas corruptos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Cambios en la distribución
Datos médicos
Sistemas de inteligencia artificial
Puntuación de Gradiente Espectral Acumulativo (CSG)
Conjuntos de datos de imágenes médicas
Cambios distribucionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los cambios en la distribución surgen comúnmente en escenarios de aprendizaje automático del mundo real en los que se viola la suposición fundamental de que los datos de entrenamiento y prueba se extraen de muestras independientes y distribuidas de manera idéntica. En el caso de los datos médicos, tales cambios en la distribución a menudo ocurren durante la adquisición de datos y representan un desafío significativo para la robustez y fiabilidad de los sistemas de inteligencia artificial en la práctica clínica. Además, cuantificar estos cambios sin entrenar un modelo sigue siendo un problema abierto clave. Este artículo propone un marco metodológico integral para evaluar el impacto de tales cambios en conjuntos de datos de imágenes médicas bajo transformaciones artificiales que simulan variaciones en la adquisición, aprovechando la puntuación del Gradiente Espectral Acumulativo (CSG) como medida de la complejidad de clasificación multiclase inducida por cambios en la distribución. Basándose en trabajos anteriores, el enfoque propuesto se extiende de manera significativa a doce puntos de referencia de imágenes médicas en 2D de la colección MedMNIST, abarcando tanto tareas binarias como multiclase, así como modalidades en escala de grises y RGB. Evaluamos la métrica analizando su robustez ante cambios en la distribución inspirados clínicamente que se simulan sistemáticamente a través de desenfoque por movimiento, ruido aditivo, variación de brillo y contraste, y variación de nitidez, cada uno aplicado en tres niveles de severidad. Esto resulta en un punto de referencia a gran escala que permite un análisis detallado de cómo las características del conjunto de datos, los tipos de transformación y la severidad de la distorsión influyen en los cambios en la distribución. Así, los hallazgos muestran que, si bien la métrica se mantiene generalmente estable bajo distorsiones de ruido y enfoque, es altamente sensible a variaciones en el brillo y el contraste. Por otro lado, la metodología propuesta se compara con la puntuación No IID de Cleanlab, ampliamente utilizada en el conjunto de datos RetinaMNIST, utilizando un modelo ResNet-50 preentrenado, incluyendo tanto análisis por clase como evaluación de correlación entre métricas. Finalmente, se incorpora la interpretabilidad a través del análisis del mapa de activación de clase en BloodMNIST y sus variantes corruptas para apoyar y contextualizar los hallazgos cuantitativos.
Descripción
Los cambios en la distribución surgen comúnmente en escenarios de aprendizaje automático del mundo real en los que se viola la suposición fundamental de que los datos de entrenamiento y prueba se extraen de muestras independientes y distribuidas de manera idéntica. En el caso de los datos médicos, tales cambios en la distribución a menudo ocurren durante la adquisición de datos y representan un desafío significativo para la robustez y fiabilidad de los sistemas de inteligencia artificial en la práctica clínica. Además, cuantificar estos cambios sin entrenar un modelo sigue siendo un problema abierto clave. Este artículo propone un marco metodológico integral para evaluar el impacto de tales cambios en conjuntos de datos de imágenes médicas bajo transformaciones artificiales que simulan variaciones en la adquisición, aprovechando la puntuación del Gradiente Espectral Acumulativo (CSG) como medida de la complejidad de clasificación multiclase inducida por cambios en la distribución. Basándose en trabajos anteriores, el enfoque propuesto se extiende de manera significativa a doce puntos de referencia de imágenes médicas en 2D de la colección MedMNIST, abarcando tanto tareas binarias como multiclase, así como modalidades en escala de grises y RGB. Evaluamos la métrica analizando su robustez ante cambios en la distribución inspirados clínicamente que se simulan sistemáticamente a través de desenfoque por movimiento, ruido aditivo, variación de brillo y contraste, y variación de nitidez, cada uno aplicado en tres niveles de severidad. Esto resulta en un punto de referencia a gran escala que permite un análisis detallado de cómo las características del conjunto de datos, los tipos de transformación y la severidad de la distorsión influyen en los cambios en la distribución. Así, los hallazgos muestran que, si bien la métrica se mantiene generalmente estable bajo distorsiones de ruido y enfoque, es altamente sensible a variaciones en el brillo y el contraste. Por otro lado, la metodología propuesta se compara con la puntuación No IID de Cleanlab, ampliamente utilizada en el conjunto de datos RetinaMNIST, utilizando un modelo ResNet-50 preentrenado, incluyendo tanto análisis por clase como evaluación de correlación entre métricas. Finalmente, se incorpora la interpretabilidad a través del análisis del mapa de activación de clase en BloodMNIST y sus variantes corruptas para apoyar y contextualizar los hallazgos cuantitativos.