Un método conjunto de corrección de lotes y agrupamiento adaptativo de datos transcriptómicos de células individuales
Autores: An, Sijing; Shi, Jinhui; Liu, Runyan; Wang, Jing; Hu, Shuofeng; Dong, Guohua; Ying, Xiaomin; He, Zhen
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un método conjunto de corrección de lotes y agrupamiento adaptativo de datos transcriptómicos de células individuales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Análisis de agrupamiento
Secuenciación de ARN de células individuales
Datos de scRNA-seq
Efectos de lote
DACAL
Tipos de células
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
El análisis de agrupamiento para datos de secuenciación de ARN de una sola célula (scRNA-seq) es esencial para caracterizar la heterogeneidad celular. Sin embargo, la información de lote causada por efectos de lote a menudo se confunde con la información biológica intrínseca en los datos de scRNA-seq, lo que hace que el agrupamiento preciso sea bastante desafiante. Se propone aquí un método de Agrupamiento Profundo Adaptativo con Aprendizaje Adversario (DACAL). DACAL optimiza conjuntamente los procesos de corrección de lotes y agrupamiento para eliminar los efectos de lote mientras se retiene la información biológica. DACAL logra la corrección de lotes y el agrupamiento adaptativo sin necesidad de especificar manualmente tipos de células o parámetros de resolución. DACAL se compara con otros métodos ampliamente utilizados de corrección de lotes y agrupamiento en conjuntos de datos de páncreas humano de diferentes plataformas de secuenciación y conjuntos de datos de mama de ratón de diferentes laboratorios. Los resultados demuestran que DACAL puede corregir eficientemente los efectos de lote y encontrar de manera adaptativa tipos celulares precisos, superando a los métodos competidores. Además, puede obtener subtipos celulares con significados biológicos.
Descripción
El análisis de agrupamiento para datos de secuenciación de ARN de una sola célula (scRNA-seq) es esencial para caracterizar la heterogeneidad celular. Sin embargo, la información de lote causada por efectos de lote a menudo se confunde con la información biológica intrínseca en los datos de scRNA-seq, lo que hace que el agrupamiento preciso sea bastante desafiante. Se propone aquí un método de Agrupamiento Profundo Adaptativo con Aprendizaje Adversario (DACAL). DACAL optimiza conjuntamente los procesos de corrección de lotes y agrupamiento para eliminar los efectos de lote mientras se retiene la información biológica. DACAL logra la corrección de lotes y el agrupamiento adaptativo sin necesidad de especificar manualmente tipos de células o parámetros de resolución. DACAL se compara con otros métodos ampliamente utilizados de corrección de lotes y agrupamiento en conjuntos de datos de páncreas humano de diferentes plataformas de secuenciación y conjuntos de datos de mama de ratón de diferentes laboratorios. Los resultados demuestran que DACAL puede corregir eficientemente los efectos de lote y encontrar de manera adaptativa tipos celulares precisos, superando a los métodos competidores. Además, puede obtener subtipos celulares con significados biológicos.