scVGATAE: Un modelo de autoencoder atencional variacional de grafos para la agrupación de datos de RNA-seq de células individuales
Autores: Liu, Lijun; Wu, Xiaoyang; Yu, Jun; Zhang, Yuduo; Niu, Kaixing; Yu, Anli
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
scVGATAE: Un modelo de autoencoder atencional variacional de grafos para la agrupación de datos de RNA-seq de células individuales
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Secuenciación de ARN de una sola célula
ScRNA-seq
Heterogeneidad celular
Subpoblaciones celulares
Trayectorias de desarrollo
Agrupamiento no supervisado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
La secuenciación de ARN de una sola célula (scRNA-seq) es ahora una tecnología exitosa para identificar la heterogeneidad celular, revelar nuevas subpoblaciones celulares y predecir trayectorias de desarrollo. Un componente crucial en scRNA-seq es la identificación precisa de subconjuntos celulares. Aunque se han desarrollado muchos métodos de agrupamiento no supervisados para agrupar subpoblaciones celulares, el rendimiento de estos métodos tiende a verse afectado por la pérdida de datos, la alta dimensionalidad y el ruido técnico. Además, la mayoría de los métodos existentes son lentos y no logran considerar completamente las posibles correlaciones entre las células. En este artículo, proponemos un nuevo método de agrupamiento no supervisado llamado scVGATAE (Autoencoder de Atención de Gráfico Variacional de Células Únicas) para datos de scRNA-seq. Este método construye un gráfico celular confiable a través de la eliminación de ruido en la red, utiliza un nuevo modelo de autoencoder de gráfico variacional integrado con redes de atención de gráfico para agregar información de vecinos y aprender la distribución de las representaciones de baja dimensión de las células, y determina de manera adaptativa las iteraciones de entrenamiento del modelo para varios conjuntos de datos. Finalmente, las representaciones de baja dimensión de las células obtenidas se agrupan utilizando kmeans. Los experimentos en nueve conjuntos de datos públicos muestran que scVGATAE supera a los métodos de agrupamiento clásicos y de última generación.
Descripción
La secuenciación de ARN de una sola célula (scRNA-seq) es ahora una tecnología exitosa para identificar la heterogeneidad celular, revelar nuevas subpoblaciones celulares y predecir trayectorias de desarrollo. Un componente crucial en scRNA-seq es la identificación precisa de subconjuntos celulares. Aunque se han desarrollado muchos métodos de agrupamiento no supervisados para agrupar subpoblaciones celulares, el rendimiento de estos métodos tiende a verse afectado por la pérdida de datos, la alta dimensionalidad y el ruido técnico. Además, la mayoría de los métodos existentes son lentos y no logran considerar completamente las posibles correlaciones entre las células. En este artículo, proponemos un nuevo método de agrupamiento no supervisado llamado scVGATAE (Autoencoder de Atención de Gráfico Variacional de Células Únicas) para datos de scRNA-seq. Este método construye un gráfico celular confiable a través de la eliminación de ruido en la red, utiliza un nuevo modelo de autoencoder de gráfico variacional integrado con redes de atención de gráfico para agregar información de vecinos y aprender la distribución de las representaciones de baja dimensión de las células, y determina de manera adaptativa las iteraciones de entrenamiento del modelo para varios conjuntos de datos. Finalmente, las representaciones de baja dimensión de las células obtenidas se agrupan utilizando kmeans. Los experimentos en nueve conjuntos de datos públicos muestran que scVGATAE supera a los métodos de agrupamiento clásicos y de última generación.