logo móvil
Contáctanos

Modelo de aprendizaje automático para la identificación de biomarcadores de multiómica para el estado de la menopausia en el cáncer de mama

Autores: Alghanim, Firas; Al-Hurani, Ibrahim; Qattous, Hazem; Al-Refai, Abdullah; Batiha, Osamah; Alkhateeb, Abedalrhman; Ikki, Salama

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Modelo de aprendizaje automático para la identificación de biomarcadores de multiómica para el estado de la menopausia en el cáncer de mama


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Menopausia
Biomarcadores del cáncer de mama
Multiómica
Metilación del ADN
Expresión génica
Alteración del número de copias

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones


Descripción
Identificar biomarcadores de cáncer de mama relacionados con la menopausia es crucial para mejorar el diagnóstico, pronóstico y tratamiento personalizado en esa etapa de la vida del paciente. En este documento, presentamos un marco integral para extraer biomarcadores multiómicos específicamente relacionados con la incidencia de cáncer de mama antes y después de la menopausia. Nuestro enfoque integra datos de metilación del ADN, expresión génica y alteración del número de copias utilizando un pipeline sistemático que abarca el preprocesamiento de datos y el manejo del desequilibrio de clases, la reducción de dimensionalidad y la clasificación. El marco comienza con MutSigCV para el preprocesamiento de datos y garantizar la calidad de los datos. La técnica de sobremuestreo Synthetic Minority Over-sampling Technique (SMOTE) se aplica para abordar la representación del desequilibrio de clases. Luego, el Análisis de Componentes Principales (PCA) transforma los datos de metilación del ADN, expresión génica y alteración del número de copias en un espacio latente. El propósito es descartar variaciones irrelevantes y extraer información relevante. Finalmente, se construye un modelo de clasificación basado en los datos multiómicos transformados en una representación unificada. El marco contribuye a comprender la compleja interacción entre la menopausia y el cáncer de mama, revelando así estrategias diagnósticas y terapéuticas más precisas en el futuro. El modelo de inteligencia artificial explicativa Shapley basado en el regresor XGBoost mostró el poder de las expresiones génicas seleccionadas para predecir el estado de la menopausia, y los biomarcadores potenciales incluyeron RUNX1, PTEN, MAP3K1 y CDH1. La literatura confirmó los hallazgos.

Otros recursos que podrían interesarte

Temas Virtualpro