Clasificación de Tumores de Cáncer de Mama Usando un Conjunto de Características Convolucionales Profundas de Múltiples Resoluciones
Autores: Clement, David; Agu, Emmanuel; Obayemi, John; Adeshina, Steve; Soboyejo, Wole
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Clasificación de Tumores de Cáncer de Mama Usando un Conjunto de Características Convolucionales Profundas de Múltiples Resoluciones
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Cáncer de mama
Tumores malignos
Tumores benignos
Redes neuronales convolucionales
BoDMCF
Clasificador SVM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El cáncer de mama representa el 30% de todos los cánceres femeninos. Distinguir con precisión los tumores malignos peligrosos de los benignos inofensivos es clave para garantizar que los pacientes reciban tratamientos que salvan vidas a tiempo. Sin embargo, dado que los médicos actualmente no identifican entre el 10% y el 30% de los cánceres de mama durante la evaluación regular, se desean métodos automatizados para detectar tumores malignos. Aunque se han propuesto varios métodos computarizados para la clasificación del cáncer de mama, las redes neuronales convolucionales (CNN) han demostrado superar a otros enfoques. En este artículo, proponemos un método automatizado para la clasificación binaria de tumores de cáncer de mama como malignos o benignos que utiliza un conjunto de características convolucionales profundas de múltiples resoluciones (BoDMCF) extraídas de imágenes histopatológicas a cuatro resoluciones (40x, 100x, 200x y 400x) mediante tres modelos de CNN profundos de última generación preentrenados: ResNet-50, EfficientNetb0 e Inception-v3. El BoDMCF extraído por las CNN preentrenadas se agrupó utilizando agrupamiento promedio global y se clasificó utilizando el clasificador de máquinas de soporte (SVM). Si bien algunos trabajos anteriores han utilizado CNN para la clasificación del cáncer de mama, no exploraron el uso de CNN para extraer y agrupar un conjunto de características profundas de múltiples resoluciones. Otros trabajos anteriores utilizaron CNN para la extracción de características profundas de múltiples resoluciones de radiografías de tórax para detectar otras condiciones como la neumoconiosis, pero no para la detección de cáncer de mama a partir de imágenes histopatológicas. En rigurosos experimentos de evaluación, nuestro enfoque de características BoDMCF profundas con agrupamiento global logró una precisión promedio del 99.92%, una sensibilidad de 0.9987, una especificidad (o recuperación) de 0.9797, un valor predictivo positivo (PPV) o precisión de 0.99870, un F1-Score de 0.9987, un MCC de 0.9980, un Kappa de 0.8368 y un AUC de 0.9990 en el conjunto de datos de imágenes de cáncer de mama BreaKHis, disponible públicamente. El enfoque propuesto supera el estado del arte anterior para la clasificación histopatológica del cáncer de mama, así como un conjunto completo de líneas base de CNN, incluyendo ResNet18, InceptionV3, DenseNet201, EfficientNetb0, SqueezeNet y ShuffleNet, al clasificar imágenes en cualquier resolución individual (40x, 100x, 200x o 400x) o cuando se utiliza SVM para clasificar un BoDMCF extraído utilizando cualquier modelo de CNN preentrenado único. También demostramos a través de un conjunto de experimentos cuidadosamente construidos que cada componente de nuestro enfoque contribuye de manera no trivial a su rendimiento superior, incluyendo el aprendizaje por transferencia (preentrenamiento y ajuste fino), la extracción de características profundas a múltiples resoluciones, el agrupamiento global de características profundas multiresolución en una poderosa representación BoDMCF y la clasificación utilizando SVM.
Descripción
El cáncer de mama representa el 30% de todos los cánceres femeninos. Distinguir con precisión los tumores malignos peligrosos de los benignos inofensivos es clave para garantizar que los pacientes reciban tratamientos que salvan vidas a tiempo. Sin embargo, dado que los médicos actualmente no identifican entre el 10% y el 30% de los cánceres de mama durante la evaluación regular, se desean métodos automatizados para detectar tumores malignos. Aunque se han propuesto varios métodos computarizados para la clasificación del cáncer de mama, las redes neuronales convolucionales (CNN) han demostrado superar a otros enfoques. En este artículo, proponemos un método automatizado para la clasificación binaria de tumores de cáncer de mama como malignos o benignos que utiliza un conjunto de características convolucionales profundas de múltiples resoluciones (BoDMCF) extraídas de imágenes histopatológicas a cuatro resoluciones (40x, 100x, 200x y 400x) mediante tres modelos de CNN profundos de última generación preentrenados: ResNet-50, EfficientNetb0 e Inception-v3. El BoDMCF extraído por las CNN preentrenadas se agrupó utilizando agrupamiento promedio global y se clasificó utilizando el clasificador de máquinas de soporte (SVM). Si bien algunos trabajos anteriores han utilizado CNN para la clasificación del cáncer de mama, no exploraron el uso de CNN para extraer y agrupar un conjunto de características profundas de múltiples resoluciones. Otros trabajos anteriores utilizaron CNN para la extracción de características profundas de múltiples resoluciones de radiografías de tórax para detectar otras condiciones como la neumoconiosis, pero no para la detección de cáncer de mama a partir de imágenes histopatológicas. En rigurosos experimentos de evaluación, nuestro enfoque de características BoDMCF profundas con agrupamiento global logró una precisión promedio del 99.92%, una sensibilidad de 0.9987, una especificidad (o recuperación) de 0.9797, un valor predictivo positivo (PPV) o precisión de 0.99870, un F1-Score de 0.9987, un MCC de 0.9980, un Kappa de 0.8368 y un AUC de 0.9990 en el conjunto de datos de imágenes de cáncer de mama BreaKHis, disponible públicamente. El enfoque propuesto supera el estado del arte anterior para la clasificación histopatológica del cáncer de mama, así como un conjunto completo de líneas base de CNN, incluyendo ResNet18, InceptionV3, DenseNet201, EfficientNetb0, SqueezeNet y ShuffleNet, al clasificar imágenes en cualquier resolución individual (40x, 100x, 200x o 400x) o cuando se utiliza SVM para clasificar un BoDMCF extraído utilizando cualquier modelo de CNN preentrenado único. También demostramos a través de un conjunto de experimentos cuidadosamente construidos que cada componente de nuestro enfoque contribuye de manera no trivial a su rendimiento superior, incluyendo el aprendizaje por transferencia (preentrenamiento y ajuste fino), la extracción de características profundas a múltiples resoluciones, el agrupamiento global de características profundas multiresolución en una poderosa representación BoDMCF y la clasificación utilizando SVM.