Predicción de Genes de Conductor Personalizados Usando Redes Neuronales Convolucionales de Grafos con Campos Aleatorios Condicionales
Autores: Wei, Pi-Jing; Zhu, An-Dong; Cao, Ruifen; Zheng, Chunhou
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Predicción de Genes de Conductor Personalizados Usando Redes Neuronales Convolucionales de Grafos con Campos Aleatorios Condicionales
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Cáncer
Genes conductores
Nivel individual
Método PDGCN
Métodos computacionales
Conjunto de datos TCGA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
El cáncer es una enfermedad compleja y evolutiva impulsada principalmente por la acumulación de variaciones genéticas en los genes. Identificar los genes impulsores del cáncer es importante. Sin embargo, la mayoría de los estudios relacionados se han centrado en el nivel poblacional. El cáncer es una enfermedad con alta heterogeneidad. Por lo tanto, el descubrimiento de genes impulsores a nivel individual se está volviendo más valioso, pero es un gran desafío. Aunque se han propuesto algunos métodos computacionales para abordar este desafío, pocos pueden cubrir bien todas las muestras de pacientes, y aún hay margen para mejorar el rendimiento. En este estudio, para identificar genes impulsores a nivel individual de manera más eficiente, proponemos el método PDGCN. PDGCN integra múltiples tipos de características de datos, incluyendo mutación, expresión, metilación, datos de número de copias y características de genes a nivel de sistema, junto con características estructurales de la red extraídas utilizando Node2vec para construir una red de interacción muestra-gene. La predicción se realiza utilizando un modelo de red neuronal convolucional gráfica con una capa de campo aleatorio condicional, que puede combinar mejor las características estructurales de la red con las características biológicas. Los experimentos en los conjuntos de datos ACC (Cáncer Adrenocortical) y KICH (Cromófobo Renal) de TCGA (El Atlas del Genoma del Cáncer) demostraron que el método tiene un mejor rendimiento en comparación con otros métodos similares. Puede identificar no solo genes impulsores frecuentemente mutados, sino también genes impulsores candidatos raros y nuevos genes biomarcadores. Los resultados de los análisis de supervivencia y enriquecimiento de estos genes detectados demuestran que el método puede identificar genes impulsores importantes a nivel individual.
Descripción
El cáncer es una enfermedad compleja y evolutiva impulsada principalmente por la acumulación de variaciones genéticas en los genes. Identificar los genes impulsores del cáncer es importante. Sin embargo, la mayoría de los estudios relacionados se han centrado en el nivel poblacional. El cáncer es una enfermedad con alta heterogeneidad. Por lo tanto, el descubrimiento de genes impulsores a nivel individual se está volviendo más valioso, pero es un gran desafío. Aunque se han propuesto algunos métodos computacionales para abordar este desafío, pocos pueden cubrir bien todas las muestras de pacientes, y aún hay margen para mejorar el rendimiento. En este estudio, para identificar genes impulsores a nivel individual de manera más eficiente, proponemos el método PDGCN. PDGCN integra múltiples tipos de características de datos, incluyendo mutación, expresión, metilación, datos de número de copias y características de genes a nivel de sistema, junto con características estructurales de la red extraídas utilizando Node2vec para construir una red de interacción muestra-gene. La predicción se realiza utilizando un modelo de red neuronal convolucional gráfica con una capa de campo aleatorio condicional, que puede combinar mejor las características estructurales de la red con las características biológicas. Los experimentos en los conjuntos de datos ACC (Cáncer Adrenocortical) y KICH (Cromófobo Renal) de TCGA (El Atlas del Genoma del Cáncer) demostraron que el método tiene un mejor rendimiento en comparación con otros métodos similares. Puede identificar no solo genes impulsores frecuentemente mutados, sino también genes impulsores candidatos raros y nuevos genes biomarcadores. Los resultados de los análisis de supervivencia y enriquecimiento de estos genes detectados demuestran que el método puede identificar genes impulsores importantes a nivel individual.