在中篇中,我们介绍了IPA对比分析、Graphical Summary和核心分析中的经典通路。通过对比分析,用户可以清晰地观察各个细胞类型在经典通路、上游分析、下游效应、调节因子等维度的差异和相似性。而且,每个核心分析的Graphical Summary通过机器学习总结了关键的结论。在经典通路页面,用户可以体验丰富的交互式网络图,轻松查看分析结果。在下篇我们将继续探索疾病和功能、上游调节因子,找出因果关系,构建网络。
1. 下游分析:探索疾病和功能
这也是核心分析结果的一部分,疾病和功能热图中的聚类显示了这些单细胞簇中的基因表达如何导致各个不同的生物学解释。例如,与其他簇相比,肝星状细胞被预测为微管动力学增加,而肝细胞被预测为类固醇和萜类相关合成和代谢功能的活性增加。
图1:疾病与功能对比分析热图的局部
单击肝细胞的类固醇合成热图方块,然后单击Edit Network按钮,通过Overlay功能叠加其他数据集(即其他细胞簇的数据),即可如图2所示查看网络。网络显示了肝细胞簇中的哪些基因有助于类固醇合成增加。大多数基因在肝细胞中上调(每个节点最左侧的小条形图),很少有基因在其他两种细胞类型中差异表达(每个节点中间和右侧的小条形图)。
图2:肝细胞中影响类固醇合成功能的基因网络
这个网络图中观察到的基因表达模式是否已有文章发表了相似或相反的模式呢?点击网络上方工具栏中的Pattern Search按钮,就可以启动该网络中基因表达模式的数据集搜索。该模式由38个基因组成(36个上调,2个下调),图3即为Pattern Search结果图。
图3:肝细胞中参与类固醇合成的基因的模式搜索结果,每个点代表一个数据集
选择感兴趣的几个数据集,点击Gene Heatmap即可打开热图,查看基因层面所选数据集中的差异。在所有匹配的单细胞分析中,没有发现哪个特定的基因在所有数据集中都有表达。但大多数基因,如APOB或SERPINA1,在大多数单细胞簇中有表达。
图4:与类固醇基因信号合成相匹配的前20个数据集的热图
2. 上游调节因子是如何对生物功能产生因果影响的
在核心分析的Upstream Analysis页面,您可以筛选Molecule Type(如化学物质、激酶、细胞因子等),如下图所示为仅包括“转录调节因子”的上游调节因子(排除了其他类型的调节因子)。
图5:筛选transcription regulator后,按z-score排序后肝细胞簇中得分最高的转录调节因子列表
为了了解top调节因子如何影响下游功能(causal impact),我们可以将调节因子添加到新的通路画布中(即My Pathway功能),并使用Build下的Grow to Disease and Functions功能,如下所示:
图6:探索top调节因子如何影响下游(Build > Grow > Diseases and Functions.)
选择感兴趣的疾病和功能后点击Apply即可在网络图中添加疾病及关系连线,如下所示为使用了分子活性预测(MAP工具)的网络图,它模拟了“激活”与肝细胞分化和胆固醇代谢相关的多个基因的因果影响是导致这些功能增加。MAP依据已发表文献中的知识发现进行预测,而非通过算法等预测。
图7:MAP预测基因上调对功能的因果影响
由于这些是IPA所预测的上游调节因子,并且相关细胞类型中的组织或细胞类型表达并未计入产生这种预测的z-score计算中,因此这些调节因子很可能没有在肝细胞中表达。但在IPA中,通过Overlay细胞和组织功能,您可以轻松快速地确认哪些细胞类型表达这五种基因。此功能使用的是来自人类蛋白质图谱的RNA-seq单细胞数据来识别在网络或通路上表达该基因的细胞类型。
如下图所示,上游调节基因在细胞和组织叠加层所有的细胞类型中,肝细胞的表达较为明显,这与上游分析鉴定出肝细胞中关键转录驱动因子的这些基因一致,形成了相互印证。
图8:鉴定表达通路里基因的细胞类型(Overlay > Cells and Tissues)
IPA还有许多分析单细胞数据的其他有用方法,其应用领域也非常广泛,本教程只介绍了其中的一些方法。希望IPA能够为您的研究课题带来帮助,能够使您更方便高效地探索自己的单细胞数据!
欢迎联系源资科技获取本示例中的单细胞分析数据,若您在分析时遇到问题,我们会竭诚为您解答。