DeepSGP: aprendizaje profundo para selección de genes y predicción de grupos de supervivencia en glioblastoma
Autores: Kirtania, Ritaban; Banerjee, Subhashis; Laha, Sayantan; Shankar, B. Uma; Chatterjee, Raghunath; Mitra, Sushmita
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
DeepSGP: aprendizaje profundo para selección de genes y predicción de grupos de supervivencia en glioblastoma
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Glioblastoma multiforme
Datos de secuenciación de ARN
Supervivencia global
Genes diferencialmente expresados
Aprendizaje profundo
Extracción de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
El glioblastoma multiforme (GBM) es una forma agresiva de glioma, que presenta una supervivencia muy pobre. La entrada genómica, en forma de datos de secuenciación de ARN (RNA-seq), se espera que proporcione información vital sobre las características de los genes que afectan la Supervivencia Global (OS) de los pacientes. Esto podría tener un impacto significativo en la planificación del tratamiento. Presentamos una nueva estrategia basada en un autoencoder (AE) para la predicción de la supervivencia (baja o alta) de pacientes con GBM, utilizando los datos de RNA-seq de 129 muestras de GBM del Atlas del Genoma del Cáncer (TCGA). Se trata de un enfoque interdisciplinario novedoso para integrar la genómica con el aprendizaje profundo hacia la predicción de la supervivencia. Primero, se seleccionaron los Genes Diferencialmente Expresados (DEGs) utilizando EdgeR. Estos se redujeron aún más mediante un análisis basado en correlaciones. Esto fue seguido por la aplicación de un ranking con diferentes algoritmos de selección de subconjuntos de características y extracción de características, incluido el AE. En cada caso, se seleccionaron/extrajeron cincuenta características, para su posterior predicción con diferentes clasificadores. Un estudio exhaustivo para la predicción del grupo de supervivencia, utilizando ocho clasificadores diferentes con la precisión y el Área Bajo la Curva (AUC), estableció la superioridad del método de extracción de características basado en AE, llamado DeepSGP. Produjo una precisión muy alta (0,83) y un AUC (0,90). De los ocho clasificadores, utilizando las características extraídas por DeepSGP, el MLP fue el mejor en la predicción de la Supervivencia Global (OS) con una precisión del 0,89 y un AUC del 0,97. También se analizó la importancia biológica de los genes extraídos por el AE para establecer su importancia. Finalmente, se estableció la significancia estadística de la salida predicha del algoritmo DeepSGP utilizando el índice de concordancia.
Descripción
El glioblastoma multiforme (GBM) es una forma agresiva de glioma, que presenta una supervivencia muy pobre. La entrada genómica, en forma de datos de secuenciación de ARN (RNA-seq), se espera que proporcione información vital sobre las características de los genes que afectan la Supervivencia Global (OS) de los pacientes. Esto podría tener un impacto significativo en la planificación del tratamiento. Presentamos una nueva estrategia basada en un autoencoder (AE) para la predicción de la supervivencia (baja o alta) de pacientes con GBM, utilizando los datos de RNA-seq de 129 muestras de GBM del Atlas del Genoma del Cáncer (TCGA). Se trata de un enfoque interdisciplinario novedoso para integrar la genómica con el aprendizaje profundo hacia la predicción de la supervivencia. Primero, se seleccionaron los Genes Diferencialmente Expresados (DEGs) utilizando EdgeR. Estos se redujeron aún más mediante un análisis basado en correlaciones. Esto fue seguido por la aplicación de un ranking con diferentes algoritmos de selección de subconjuntos de características y extracción de características, incluido el AE. En cada caso, se seleccionaron/extrajeron cincuenta características, para su posterior predicción con diferentes clasificadores. Un estudio exhaustivo para la predicción del grupo de supervivencia, utilizando ocho clasificadores diferentes con la precisión y el Área Bajo la Curva (AUC), estableció la superioridad del método de extracción de características basado en AE, llamado DeepSGP. Produjo una precisión muy alta (0,83) y un AUC (0,90). De los ocho clasificadores, utilizando las características extraídas por DeepSGP, el MLP fue el mejor en la predicción de la Supervivencia Global (OS) con una precisión del 0,89 y un AUC del 0,97. También se analizó la importancia biológica de los genes extraídos por el AE para establecer su importancia. Finalmente, se estableció la significancia estadística de la salida predicha del algoritmo DeepSGP utilizando el índice de concordancia.