Construcción y proyección de espacio homogéneo para la predicción de expresión de células individuales basada en aprendizaje profundo
Autores: Yeh, Chia-Hung; Chen, Ze-Guang; Liou, Cheng-Yue; Chen, Mei-Juan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Construcción y proyección de espacio homogéneo para la predicción de expresión de células individuales basada en aprendizaje profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Respuestas celulares
Perturbaciones
Modelos de aprendizaje profundo
Relaciones gen-gen
Autoencoder variacional navegado por información
Precisión de predicción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
Predecir las respuestas celulares a las perturbaciones es un problema no resuelto en biología. Los enfoques tradicionales asumen que los diferentes tipos de células responden de manera similar a las perturbaciones. Sin embargo, esta suposición no tiene en cuenta el contexto de las interacciones genómicas en diferentes tipos de células, lo que lleva a una calidad de predicción comprometida. Más recientemente, los modelos de aprendizaje profundo utilizados para descubrir relaciones gen-gen pueden generar predicciones más precisas de las respuestas celulares. La gran diferencia en la información biológica entre diferentes tipos de células hace que sea difícil para los modelos de aprendizaje profundo codificar datos en un espacio de características continuas de baja dimensión, lo que significa que las características capturadas por el espacio latente pueden no ser continuas. Por lo tanto, la relación de mapeo entre los dos espacios condicionales aprendidos por el modelo solo se puede aplicar donde residen los datos de referencia reales, lo que lleva al mapeo incorrecto de las células objetivo predichas porque no están en el mismo dominio que los datos de referencia. En este artículo, proponemos un autoencoder variacional guiado por información (INVAE), una red neuronal profunda para la predicción de respuestas a perturbaciones celulares. INVAE filtra la información que no es propicia para el rendimiento predictivo. Para la información restante, INVAE construye un espacio homogéneo de condiciones de control y encuentra la relación de mapeo entre el espacio de condiciones de control y el espacio de condiciones de perturbación. Al incrustar la unidad objetivo en el espacio de control y luego mapearla al espacio de perturbación, podemos predecir el estado perturbado de la unidad objetivo. Comparando nuestro método propuesto con otros tres métodos de vanguardia en tres conjuntos de datos reales, los resultados experimentales muestran que INVAE supera a los métodos existentes en la predicción del estado celular después de la perturbación. Además, demostramos que filtrar la información inútil no solo mejora la precisión de la predicción, sino que también revela similitudes en cómo se regulan los genes en diferentes tipos de células después de la perturbación.
Descripción
Predecir las respuestas celulares a las perturbaciones es un problema no resuelto en biología. Los enfoques tradicionales asumen que los diferentes tipos de células responden de manera similar a las perturbaciones. Sin embargo, esta suposición no tiene en cuenta el contexto de las interacciones genómicas en diferentes tipos de células, lo que lleva a una calidad de predicción comprometida. Más recientemente, los modelos de aprendizaje profundo utilizados para descubrir relaciones gen-gen pueden generar predicciones más precisas de las respuestas celulares. La gran diferencia en la información biológica entre diferentes tipos de células hace que sea difícil para los modelos de aprendizaje profundo codificar datos en un espacio de características continuas de baja dimensión, lo que significa que las características capturadas por el espacio latente pueden no ser continuas. Por lo tanto, la relación de mapeo entre los dos espacios condicionales aprendidos por el modelo solo se puede aplicar donde residen los datos de referencia reales, lo que lleva al mapeo incorrecto de las células objetivo predichas porque no están en el mismo dominio que los datos de referencia. En este artículo, proponemos un autoencoder variacional guiado por información (INVAE), una red neuronal profunda para la predicción de respuestas a perturbaciones celulares. INVAE filtra la información que no es propicia para el rendimiento predictivo. Para la información restante, INVAE construye un espacio homogéneo de condiciones de control y encuentra la relación de mapeo entre el espacio de condiciones de control y el espacio de condiciones de perturbación. Al incrustar la unidad objetivo en el espacio de control y luego mapearla al espacio de perturbación, podemos predecir el estado perturbado de la unidad objetivo. Comparando nuestro método propuesto con otros tres métodos de vanguardia en tres conjuntos de datos reales, los resultados experimentales muestran que INVAE supera a los métodos existentes en la predicción del estado celular después de la perturbación. Además, demostramos que filtrar la información inútil no solo mejora la precisión de la predicción, sino que también revela similitudes en cómo se regulan los genes en diferentes tipos de células después de la perturbación.