文献案例:高致病性ST5甲氧西林敏感金黄色葡萄球菌亚型的流行率不断上升,对临床构成严重威胁(2021年)
来自上海交通大学的研究人员对121株ST5克隆型金黄色葡萄球菌分离株进行了全基因组测序(WGS),并对ST5基因的进化进行了表征,发现了甲氧西林敏感金黄色葡萄球菌(MSSA)是独立进化的,是与其他耐甲氧西林金黄色葡萄球菌(MRSA)不同的亚型。利用NGS数据进行的耐药基因分析表明,ST5克隆型MRSA在抗菌药物的威胁下可能更具耐受性,这在进一步的体外药敏试验中也得到了证实。通过毒力因子分析,发现MSSA亚型菌株表现出较高的毒力。
具体的生信分析步骤为:
1. 全基因组测序数据的质量控制
使用CLC中的质量控制工具进行read质量控制,并在组装前过滤原始数据。此外,移除含有10%以上模糊N碱基的序列或长度小于30 bp的序列。121株菌株(包括79株MRSA菌株和42株MSSA菌株)的测序数据都通过了质量控制程序。
2. 修剪、映射、SNP calling和系统发育树构建
使用CLC对原始数据修剪,删除adaptor序列和低质量序列,进行全基因组比对、SNP calling和系统发育分析。获得了质控后的读数。在CLC中构建了最大似然(maximum likelihood, ML)树,该树使用了具有4个类别的核苷酸替换的广义时间可逆模型(general time reversible, GTR)。
3. 从头组装,检测耐药基因和毒力相关基因
使用CLC默认参数从头组装了质控后的数据。然后,利用生成的从头组装的重叠群(contig)在耐药基因数据库(ResFinder)和毒力因子数据库(VFDB)确认是否存在耐药基因或毒力因子。用VFDB进行BLAST时检测到了IEC(immune evasion cluster)基因(如sea、chp、scn和sak)。
下图为121株ST5克隆型金黄色葡萄球菌分离株的耐药基因(左)、预测表型(中)(均使用了ResFinder数据库在CLC中进行分析)和抗生素敏感性谱(右)(从上到下分别为Clade I MRSA、Clade II MRSA、Clade III MRSA和Clade MSSA中的分离株)。
下图展示了121株ST5克隆型菌株的毒力特征(使用了VFDB数据库在CLC中进行分析),以及在金黄色葡萄球菌的四个分支中缺失或存在的毒力因子(从上到下分别是分支I MRSA、分支II MRSA、分支III MRSA和分支MSSA中的菌株)。
CLC中丰富的微生物数据库
在工具箱中搜索,我们可以找到CLC中下载微生物相关数据库的工具(如下图)。依据分析目的,可以分为大致5类数据库:MLST分型、扩增子分析、群落分类分析、功能分析、耐药性分析。
CLC中的耐药性分析数据库包含下图中的内容。其中QMI-AR(QIAGEN Microbial Insight - Antimicrobial Resistance database)是QIAGEN人工整理的数据库,包含多个来源的肽标记、核苷酸序列信息。欢迎联系我们了解其他分类的数据库内容。
CLC分析平台是利用图形用户界面构建、管理和部署分析工作流的商业化生物信息学分析平台。靠前版本于2008年推出,迄今已经有近15年的发展历史。目前CLC Genomics Workbench最新版本为V22.0.2,而且其中的CLC Microbial Genomics Module于六月中旬更新到了V22.1。CLC是一个历史悠久、更新维护频繁的生信分析利器,我们等您来体验。
[参考资料]
1. Jian, Ying, et al. "Increasing prevalence of hypervirulent ST5 methicillin susceptible Staphylococcus aureus subtype poses a serious clinical threat." Emerging Microbes & Infections 10.1 (2021): 109-122.
2. QIAGEN CLC Genomics Workbench (archive): Latest improvements for QIAGEN CLC Genomics Workbench
3. Wikipedia contributors. (2021, June 26). CLC bio. In Wikipedia, The Free Encyclopedia. Retrieved on June 24, 2022, from https://en.wikipedia.org/w/index.php?title=CLC_bio&oldid=1030588427