Un modelo híbrido ligero CNN-CBAM para la clasificación de leucemia linfoblástica aguda multietapa a partir de imágenes de frotis de sangre periférica
Autores: Wisaeng, Kittipol
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un modelo híbrido ligero CNN-CBAM para la clasificación de leucemia linfoblástica aguda multietapa a partir de imágenes de frotis de sangre periférica
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Clasificación
Malignidades hematológicas
Frotis de sangre periférica
Aprendizaje profundo
Leucemia linfoblástica aguda
Segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La clasificación precisa y eficiente de las malignidades hematológicas a partir de imágenes de frotis de sangre periférica (PBS) sigue siendo un desafío debido a la escasez de conjuntos de datos anotados, la variabilidad en la tinción y las sutiles diferencias morfológicas entre los subtipos de cáncer de sangre. Para abordar estas limitaciones, este estudio propone un marco de Aprendizaje Profundo Ligero Avanzado (ALDL) para la clasificación multiclase de la Leucemia Linfoblástica Aguda (ALL) en cuatro etapas clínicamente significativas: Benigna, Pro-B, Pre-B y Pre-B Temprana. El marco integra EfficientNetV2-S con Módulos de Atención de Bloque Convolucional (CBAM) para mejorar el refinamiento de características espaciales y por canal. Al mismo tiempo, se emplea la Pérdida Focal para mitigar el desequilibrio de clases priorizando muestras difíciles de clasificar. Un robusto pipeline de preprocesamiento, que incluye mejora de contraste CLAHE, normalización de tinción Reinhard y aumento de datos, mejora la visibilidad de las características y la generalización del conjunto de datos. La segmentación de lesiones se realiza utilizando umbralización basada en RGB y superposición de watershed, seguida de recortes a nivel de lesión para garantizar la consistencia entre las entradas. Las evaluaciones experimentales en el conjunto de datos ALL-DB demuestran el rendimiento superior del método propuesto, logrando una precisión promedio del 96.11%, un F1-score del 95.99% y un AUC de 0.9875. Los análisis comparativos contra MobileNetV3, ResNet50, DenseNet121, VGG16 e InceptionV3 confirman que el marco propuesto EfficientNetV2-S + CBAM + Pérdida Focal guiado por segmentación supera consistentemente a las arquitecturas CNN convencionales en ambas divisiones de entrenamiento-prueba 70:30 y 60:40. Además, una investigación detallada de los espacios de color (RGB, HSV, LAB y HED) indica que RGB produce los resultados de segmentación y clasificación más confiables. Al mismo tiempo, HED mejora la visualización de lesiones a expensas de un mayor costo computacional. El marco ALDL propuesto demuestra un gran potencial para la aplicación en el mundo real como un sistema de diagnóstico asistido por computadora (CAD) para la detección temprana de leucemia, ofreciendo una mayor fiabilidad diagnóstica, tasas de error reducidas y escalabilidad práctica para entornos clínicos.
Descripción
La clasificación precisa y eficiente de las malignidades hematológicas a partir de imágenes de frotis de sangre periférica (PBS) sigue siendo un desafío debido a la escasez de conjuntos de datos anotados, la variabilidad en la tinción y las sutiles diferencias morfológicas entre los subtipos de cáncer de sangre. Para abordar estas limitaciones, este estudio propone un marco de Aprendizaje Profundo Ligero Avanzado (ALDL) para la clasificación multiclase de la Leucemia Linfoblástica Aguda (ALL) en cuatro etapas clínicamente significativas: Benigna, Pro-B, Pre-B y Pre-B Temprana. El marco integra EfficientNetV2-S con Módulos de Atención de Bloque Convolucional (CBAM) para mejorar el refinamiento de características espaciales y por canal. Al mismo tiempo, se emplea la Pérdida Focal para mitigar el desequilibrio de clases priorizando muestras difíciles de clasificar. Un robusto pipeline de preprocesamiento, que incluye mejora de contraste CLAHE, normalización de tinción Reinhard y aumento de datos, mejora la visibilidad de las características y la generalización del conjunto de datos. La segmentación de lesiones se realiza utilizando umbralización basada en RGB y superposición de watershed, seguida de recortes a nivel de lesión para garantizar la consistencia entre las entradas. Las evaluaciones experimentales en el conjunto de datos ALL-DB demuestran el rendimiento superior del método propuesto, logrando una precisión promedio del 96.11%, un F1-score del 95.99% y un AUC de 0.9875. Los análisis comparativos contra MobileNetV3, ResNet50, DenseNet121, VGG16 e InceptionV3 confirman que el marco propuesto EfficientNetV2-S + CBAM + Pérdida Focal guiado por segmentación supera consistentemente a las arquitecturas CNN convencionales en ambas divisiones de entrenamiento-prueba 70:30 y 60:40. Además, una investigación detallada de los espacios de color (RGB, HSV, LAB y HED) indica que RGB produce los resultados de segmentación y clasificación más confiables. Al mismo tiempo, HED mejora la visualización de lesiones a expensas de un mayor costo computacional. El marco ALDL propuesto demuestra un gran potencial para la aplicación en el mundo real como un sistema de diagnóstico asistido por computadora (CAD) para la detección temprana de leucemia, ofreciendo una mayor fiabilidad diagnóstica, tasas de error reducidas y escalabilidad práctica para entornos clínicos.