Desafíos en la reducción de sesgos utilizando la equidad de postprocesamiento para la clasificación de etapa del cáncer de mama con aprendizaje profundo
Autores: Soltan, Armin; Washington, Peter
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Desafíos en la reducción de sesgos utilizando la equidad de postprocesamiento para la clasificación de etapa del cáncer de mama con aprendizaje profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Cáncer de mama
Modelos de aprendizaje profundo
Sesgo
Poblaciones diversas
Datos de entrenamiento
Equidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
El cáncer de mama es el cáncer más común que afecta a las mujeres a nivel mundial. A pesar del impacto significativo de los modelos de aprendizaje profundo en el diagnóstico y tratamiento del cáncer de mama, lograr resultados justos o equitativos en diversas poblaciones sigue siendo un desafío cuando algunos grupos demográficos están subrepresentados en los datos de entrenamiento. Cuantificamos el sesgo de los modelos entrenados para predecir la etapa del cáncer de mama a partir de un conjunto de datos que consistía en 1000 biopsias de 842 pacientes proporcionadas por AIM-Ahead (Consortio de Inteligencia Artificial/Aprendizaje Automático para Avanzar en la Equidad en Salud y Diversidad de Investigadores). Es importante destacar que la mayoría de los datos (más del 70%) eran de pacientes blancos. Descubrimos que antes de los ajustes de postprocesamiento, todos los modelos de aprendizaje profundo que entrenamos funcionaron consistentemente mejor para pacientes blancos que para pacientes no blancos. Después de la calibración del modelo, observamos resultados mixtos, con solo algunos modelos demostrando un rendimiento mejorado. Este trabajo proporciona un estudio de caso sobre el sesgo en los modelos de imágenes médicas de cáncer de mama y destaca los desafíos en el uso del postprocesamiento para intentar lograr la equidad.
Descripción
El cáncer de mama es el cáncer más común que afecta a las mujeres a nivel mundial. A pesar del impacto significativo de los modelos de aprendizaje profundo en el diagnóstico y tratamiento del cáncer de mama, lograr resultados justos o equitativos en diversas poblaciones sigue siendo un desafío cuando algunos grupos demográficos están subrepresentados en los datos de entrenamiento. Cuantificamos el sesgo de los modelos entrenados para predecir la etapa del cáncer de mama a partir de un conjunto de datos que consistía en 1000 biopsias de 842 pacientes proporcionadas por AIM-Ahead (Consortio de Inteligencia Artificial/Aprendizaje Automático para Avanzar en la Equidad en Salud y Diversidad de Investigadores). Es importante destacar que la mayoría de los datos (más del 70%) eran de pacientes blancos. Descubrimos que antes de los ajustes de postprocesamiento, todos los modelos de aprendizaje profundo que entrenamos funcionaron consistentemente mejor para pacientes blancos que para pacientes no blancos. Después de la calibración del modelo, observamos resultados mixtos, con solo algunos modelos demostrando un rendimiento mejorado. Este trabajo proporciona un estudio de caso sobre el sesgo en los modelos de imágenes médicas de cáncer de mama y destaca los desafíos en el uso del postprocesamiento para intentar lograr la equidad.