SigPrimedNet: Una Red Neuronal Informada por Señales para la Anotación de scRNA-seq de Tipos de Células Conocidos y Desconocidos
Autores: Gundogdu, Pelin; Alamo, Inmaculada; Nepomuceno-Chamorro, Isabel A.; Dopazo, Joaquin; Loucera, Carlos
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
SigPrimedNet: Una Red Neuronal Informada por Señales para la Anotación de scRNA-seq de Tipos de Células Conocidos y Desconocidos
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Secuenciación de ARN de una sola célula
Paisaje de tipos celulares
Datos de scRNA-seq
Métodos supervisados
Métodos no supervisados
SigPrimedNet
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
La secuenciación de ARN de una sola célula está aumentando nuestra comprensión del comportamiento de tejidos u órganos complejos, al proporcionar detalles sin precedentes sobre el complejo paisaje de tipos celulares a nivel de células individuales. La definición de tipos celulares y la anotación funcional son pasos clave para entender los procesos moleculares detrás de la maquinaria de comunicación celular subyacente. Sin embargo, el crecimiento exponencial de los datos de scRNA-seq ha hecho que la tarea de anotar células manualmente sea inviable, no solo debido a una resolución sin igual de la tecnología, sino a una heterogeneidad de datos en constante aumento. Se han propuesto muchos métodos supervisados y no supervisados para anotar células automáticamente. Los enfoques supervisados para la anotación de tipos celulares superan a los métodos no supervisados, excepto cuando están presentes nuevos tipos celulares (desconocidos). Aquí, introducimos SigPrimedNet, un enfoque de red neuronal artificial que aprovecha (i) un entrenamiento eficiente mediante una capa informada por circuitos de señalización que induce escasez, (ii) el aprendizaje de representación de características a través de entrenamiento supervisado, y (iii) la identificación de tipos celulares desconocidos mediante el ajuste de un método de detección de anomalías en la representación aprendida. Mostramos que SigPrimedNet puede anotar eficientemente tipos celulares conocidos mientras mantiene una baja tasa de falsos positivos para células no vistas en un conjunto de conjuntos de datos disponibles públicamente. Además, la representación aprendida actúa como un proxy para las mediciones de actividad de circuitos de señalización, que proporcionan estimaciones útiles de las funcionalidades celulares.
Descripción
La secuenciación de ARN de una sola célula está aumentando nuestra comprensión del comportamiento de tejidos u órganos complejos, al proporcionar detalles sin precedentes sobre el complejo paisaje de tipos celulares a nivel de células individuales. La definición de tipos celulares y la anotación funcional son pasos clave para entender los procesos moleculares detrás de la maquinaria de comunicación celular subyacente. Sin embargo, el crecimiento exponencial de los datos de scRNA-seq ha hecho que la tarea de anotar células manualmente sea inviable, no solo debido a una resolución sin igual de la tecnología, sino a una heterogeneidad de datos en constante aumento. Se han propuesto muchos métodos supervisados y no supervisados para anotar células automáticamente. Los enfoques supervisados para la anotación de tipos celulares superan a los métodos no supervisados, excepto cuando están presentes nuevos tipos celulares (desconocidos). Aquí, introducimos SigPrimedNet, un enfoque de red neuronal artificial que aprovecha (i) un entrenamiento eficiente mediante una capa informada por circuitos de señalización que induce escasez, (ii) el aprendizaje de representación de características a través de entrenamiento supervisado, y (iii) la identificación de tipos celulares desconocidos mediante el ajuste de un método de detección de anomalías en la representación aprendida. Mostramos que SigPrimedNet puede anotar eficientemente tipos celulares conocidos mientras mantiene una baja tasa de falsos positivos para células no vistas en un conjunto de conjuntos de datos disponibles públicamente. Además, la representación aprendida actúa como un proxy para las mediciones de actividad de circuitos de señalización, que proporcionan estimaciones útiles de las funcionalidades celulares.