AI计算模拟
AI-enriched COMPUTATIONAL SIMULATION
AI计算模拟
以AI、大数据分析及数字化工作流为基础的综合计算模拟解决方案

2022年IPA夏季更新


七月底,IPA发布了新版本,此版本对Core Analysis的分析进行了提速,而且还新增了气泡图的可视化,以及其他便捷的新功能。目前,IPA知识库数据量已超过一千万条,数据集收录超过11万个。



功能更新


1.使用气泡图可视化经典通路(Canonical Pathway)

气泡图能够以直观的形式呈现多变量数据,在IPA中,您可以用核心分析中经典通路的数值生成气泡图。下图的气泡图呈现了NRF2激活剂对经典通路活性的影响,其中颜色代表激活或抑制。气泡的大小随着每个通路的重叠基因数量的增加而增加,可以明显看出该NRF2激活剂打开了与外源代谢、毒性和细胞应激相关的多个通路(图中右下角区域)。


您也可以将气泡大小显示为右尾Fisher’s Exact test p值的负对数比例,并按通路类型(信号或代谢)对其着色。由此可以看出上图的解毒通路在下图中是一个代谢通路,且尽管该解毒通路的重叠基因数量相当少,但其具有高度的统计显著性。


气泡图有多种呈现形式,例如可以突出具有许多重叠基因的高度显著和激活的通路(下图右上角)。


2.将节点标签显示于节点下方,提高网络的可读性

IPA网络中节点的标签(例如,基因名称、疾病名称等)现在可以显示在其节点形状的下方,提高可读性,如下图。


3.支持上传其他物种的数据集,扩展您的研究

现在,您可以在IPA中分析更多物种的数据集,包括食蟹猕猴、猪等。IPA现在总共支持25个物种,如下图。


4.通过Search功能找到疾病和表型网络

在研究某种疾病时,了解相关的关键基因,以及它们如何相互作用来驱动疾病的发生,或是它们对严重程度的影响如何都是很有用的。IPA基于QIAGEN Knowledge Graph(QKG)的无监督机器学习(ML)模型,创建了一个大型疾病和表型网络库。库中的每个网络关注的是单个疾病或表型,并包含关键基因、受影响的生物功能以及它们之间的关系。此外,还叠加了预测激活的彩色图案,以显示基因的激活或抑制如何导致疾病。

无监督机器学习算法优先考虑重要的基因和功能,并生成大小合理的网络(平均每个网络约50个节点),该算法的详情可参见文献Mining hidden knowledge: Embedding models of cause-effect relationships curated from the biomedical literature。在本版本中,这些网络中有超过1500个网络现在可以通过Search功能找到。如下图所示,您可以使用疾病、表型或基因名称等术语在“Pathways and Lists”选项卡中进行搜索。


5.直接从基因视图上的链接打开经典通路,加快工作速度

点击基因视图中的经典通路超链接,即可在IPA客户端中打开该通路,如下图所示。

内容更新


本季度新增了超过45万项新发现,使得IPA知识库数据量超过一千多万条。内容包括BioGrid的蛋白-蛋白相互作用、ClinicalTrials.gov的靶点-疾病发现和药物-疾病发现、Gene Ontology的发现、CCRIS的化学物质-癌症发现、ClinVar的癌症-突变发现、IntAct的蛋白-蛋白互作发现、Mouse Genome Database的基因-疾病发现等知识内容。

在Analysis Match、Activity Plot、Pattern Search中,用户可以探索超过11万个表达数据集(具体数据统计如下表),或是将它们与自己的数据集进行比较分析。


IPA软件每季度都会进行定期的功能更新,每周进行数据的更新。欢迎联系源资科技体验新版本!