Análisis Integrativo de ATAC-Seq y RNA-Seq a través de Aprendizaje Automático Identifica 10 Genes Firma para Subtipos Intrínsecos de Cáncer de Mama
Autores: Park, Jeong-Woon; Rhee, Je-Keun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Análisis Integrativo de ATAC-Seq y RNA-Seq a través de Aprendizaje Automático Identifica 10 Genes Firma para Subtipos Intrínsecos de Cáncer de Mama
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Cáncer de mama
Subtipos
RNA-seq
ATAC-seq
Aprendizaje automático
Genes de firma
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
El cáncer de mama es una enfermedad heterogénea compuesta por varios subtipos biológicamente distintos, cada uno caracterizado por características moleculares únicas. Su formación y progresión implican un proceso complejo y multietapa que incluye la acumulación de numerosas alteraciones genéticas y epigenéticas. Aunque la integración de datos de transcriptoma de RNA-seq con información epigenética de ATAC-seq proporciona una comprensión más completa de la regulación génica y su impacto en diferentes condiciones, aún no se ha desarrollado un modelo de clasificación para los subtipos intrínsecos de cáncer de mama basado en tales análisis integrativos. En este estudio, empleamos algoritmos de aprendizaje automático para predecir subtipos intrínsecos a través del análisis integrativo de datos de ATAC-seq y RNA-seq. Identificamos 10 genes de firma utilizando eliminación recursiva de características con validación cruzada (RFECV) y una máquina de soporte vectorial (SVM) basada en la importancia de características SHAP (SHapley Additive exPlanations). Además, encontramos que estos genes estaban principalmente asociados con respuestas inmunitarias, señalización hormonal, progresión del cáncer y proliferación celular.
Descripción
El cáncer de mama es una enfermedad heterogénea compuesta por varios subtipos biológicamente distintos, cada uno caracterizado por características moleculares únicas. Su formación y progresión implican un proceso complejo y multietapa que incluye la acumulación de numerosas alteraciones genéticas y epigenéticas. Aunque la integración de datos de transcriptoma de RNA-seq con información epigenética de ATAC-seq proporciona una comprensión más completa de la regulación génica y su impacto en diferentes condiciones, aún no se ha desarrollado un modelo de clasificación para los subtipos intrínsecos de cáncer de mama basado en tales análisis integrativos. En este estudio, empleamos algoritmos de aprendizaje automático para predecir subtipos intrínsecos a través del análisis integrativo de datos de ATAC-seq y RNA-seq. Identificamos 10 genes de firma utilizando eliminación recursiva de características con validación cruzada (RFECV) y una máquina de soporte vectorial (SVM) basada en la importancia de características SHAP (SHapley Additive exPlanations). Además, encontramos que estos genes estaban principalmente asociados con respuestas inmunitarias, señalización hormonal, progresión del cáncer y proliferación celular.