Un marco de aprendizaje automático de conjunto híbrido con ingeniería de características de función de membresía para la predicción no invasiva del estado de HER2 en el cáncer de mama
Autores: Salarabadi, Hassan; Salimi, Dariush; Mohammadi Ziabari, Seyed Sahand; Aznab, Mozaffar
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un marco de aprendizaje automático de conjunto híbrido con ingeniería de características de función de membresía para la predicción no invasiva del estado de HER2 en el cáncer de mama
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Determinación
Estado de HER2
Cáncer de mama
Aprendizaje automático
Marco de conjunto
Robustez predictiva
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La determinación precisa del estado del receptor 2 del factor de crecimiento epidérmico humano (HER2) es un componente crítico del pronóstico y la planificación del tratamiento del cáncer de mama. Las técnicas de diagnóstico convencionales, como la inmunohistoquímica (IHC) y la hibridación in situ por fluorescencia (FISH), están clínicamente establecidas, pero siguen siendo invasivas, que consumen tiempo, costosas y sensibles a la variabilidad preanalítica e interpretativa. Motivado por la necesidad de herramientas de apoyo a la decisión escalables y basadas en datos, este estudio propone un marco híbrido de aprendizaje automático en conjunto para la predicción no invasiva del estado de HER2 utilizando características clínicas e inmunohistoquímicas disponibles de forma rutinaria. Se analizó un conjunto de datos retrospectivo que comprende 624 pacientes con cáncer de mama de la Clínica Mahdieh (Kermanshah, Irán) utilizando un pipeline de preprocesamiento estructurado que incluye normalización y balanceo de clases. El marco propuesto integra múltiples clasificadores basados en árboles, Random Forest, XGBoost y LightGBM, a través de estrategias de conjunto y mejora la robustez predictiva utilizando ingeniería de características de función de membresía para capturar transiciones graduales en biomarcadores clínicamente relevantes. La optimización del umbral de decisión se aplicó además para mejorar el equilibrio de clasificación en casos límite. El marco de conjunto propuesto logró una precisión de 0.816, un F1-score de 0.814 y un área bajo la curva característica del receptor (AUC) de 0.862 en un conjunto de prueba reservado, demostrando un rendimiento comparable al mejor clasificador individual. Estos resultados indican que el aprendizaje en conjunto combinado con representaciones de características basadas en membresía suaves puede proporcionar un marco de apoyo a la decisión confiable para la predicción del estado de HER2, aunque se requiere una validación externa adicional antes de su uso clínico.
Descripción
La determinación precisa del estado del receptor 2 del factor de crecimiento epidérmico humano (HER2) es un componente crítico del pronóstico y la planificación del tratamiento del cáncer de mama. Las técnicas de diagnóstico convencionales, como la inmunohistoquímica (IHC) y la hibridación in situ por fluorescencia (FISH), están clínicamente establecidas, pero siguen siendo invasivas, que consumen tiempo, costosas y sensibles a la variabilidad preanalítica e interpretativa. Motivado por la necesidad de herramientas de apoyo a la decisión escalables y basadas en datos, este estudio propone un marco híbrido de aprendizaje automático en conjunto para la predicción no invasiva del estado de HER2 utilizando características clínicas e inmunohistoquímicas disponibles de forma rutinaria. Se analizó un conjunto de datos retrospectivo que comprende 624 pacientes con cáncer de mama de la Clínica Mahdieh (Kermanshah, Irán) utilizando un pipeline de preprocesamiento estructurado que incluye normalización y balanceo de clases. El marco propuesto integra múltiples clasificadores basados en árboles, Random Forest, XGBoost y LightGBM, a través de estrategias de conjunto y mejora la robustez predictiva utilizando ingeniería de características de función de membresía para capturar transiciones graduales en biomarcadores clínicamente relevantes. La optimización del umbral de decisión se aplicó además para mejorar el equilibrio de clasificación en casos límite. El marco de conjunto propuesto logró una precisión de 0.816, un F1-score de 0.814 y un área bajo la curva característica del receptor (AUC) de 0.862 en un conjunto de prueba reservado, demostrando un rendimiento comparable al mejor clasificador individual. Estos resultados indican que el aprendizaje en conjunto combinado con representaciones de características basadas en membresía suaves puede proporcionar un marco de apoyo a la decisión confiable para la predicción del estado de HER2, aunque se requiere una validación externa adicional antes de su uso clínico.