作者:郑伟 西北农林科技大学
责编:刘永鑫 中科院遗传发育所
Zi、Pi score值中Zi指的是within-module connectivity,而Pi指的是among-module connectivity。他们一起用来表示network中每个node的拓扑属性。
Zi、Pi score值为network分析中常用的两个参数。我们都知道,Network分析现已经成为微生物组研究中比较常用的分析方法,通过network分析我们可以知道微生物群落更多信息,其中一个重要部分就是微生物群落中的Keystone species。我们常用的用来表示keystone species的方法除了betweenness centrality score之外,还有一个就是Zi、Pi score值了。
我们在network分析的一些文章中经常会看到类似如下的图,如在Jiang et al. (2016)文章中所用的:
引文见 Jiang et al. (2016) Crop rotations alter bacterial and fungal diversity in paddy soils across East Asia. Soil Biology & Biochemistry 95 250-261.
在上图中我们可以看到作者利用Zi、Pi 值将network中的OTU分成了4部分,分别为peripherals, connectors, module hubs和 network hubs。
正在生态学研究中,peripherals主要代表微生物网络中的一些specialists,而module hubs和connectors主要代表一些接近generalists的物种,network hubs主要代表微生物网络中的super-generalists。详细说明请见
Deng et al. (2012) Molecular ecological network analyses. BMC Bioinformatics 13:113.
上图详细的介绍了Zi、Pi 值的计算方法。参考文献为:
Cumbo et al. (2014) GIANT: A Cytoscape Plugin for Modular Networks. Plos One 9 e105001
下面我们详细介绍如何基于Cytoscape中的GIANT增强包来计算Zi、Pi 值,首先我们需要打开Cytoscape建立好一个network,然后打开App Manager下载GIANT增强包,如下:搜索 GIANT 包,选择后点Install安装即可。
测试这此功能,我们需要用Cytoscape打开一个网络。测试数据后台回复“GIANT”获得。方可进行下面分析。
下载好后打开GIANT增强包可以看到界面如下,如果之前你对网络图做了其他聚类分析,那么你直接可以Load Cluster data,如果没有的话也可以用包里自带的,但是只有3种(MCL,Kmeans,Spectral cluster) 。然后点击Run再点击Compute。
这个增强包只提供了MCL,Kmeans,Spectral cluster三种聚类方法:
Spectral Clustering(SC, 谱聚类)是一种基于图论的聚类方法。将带权无向图划分为两个或两个以上的最优子图,使子图内部尽量相似,而子图间距离尽量距离较远,以达到常见的聚类的目的。
K-means聚类算法,它是无监督聚类的一种,可以用距离度量来将样本集分成K个类。
MCL聚类是一种快速可度量的无监督聚类方法。
更详细的说明及计算方法可以参考
Cumbo et al. (2014) GIANT: A Cytoscape Plugin for Modular Networks. Plos One 9 e105001
这里需要大家根据自己的需求去选择聚类方法。笔者平时习惯用greedy聚类,具体算法参考中科院微生物所陈亮博士之前在公众号发表的文章:一文学会网络分析——Co-occurrence网络图在R中的实现
这里注意上传数据的格式,增强包里同样有说明
按照上面步骤,网络图的Zi、Pi 值就计算好了,其结果如下:
这个是增强包里自动出的图:
这个图实际上就是相当于文章开头我们举例中的图了,图上横坐标表示Pi 值,纵坐标表示Zi 值,但是这个图没有文章开头中表示的图清楚,因此可能还需要我们自己将数据导出(点击上一个图中的save result)去自己DIY更漂亮的图。
导出数据后,用分列分好,如下:
那么我们就得到了Zi、Pi值,注意这里由于数据格式问题小数点全部成了逗号,可能还需要我们在excel中替换一下,然后我们就可以利用excel、sigmaplot、origin或者R语言(可参考公众号之前的PCoA散点图画图教程代码《扩增子统计绘图2散点图:Beta多样性》,把PCoA1和PCoA2的得分值换成Zi、Pi 值)等软件自己画出文章开头给出的例子了。
郑伟:西北农林科技大学资源环境学院,植物营养学专业。研究方向为土壤微生物生态,具体为不同施肥方式及农业措施介导下土壤微生物群落结构及功能基因在土壤养分周转及作物营养吸收方面的相互作用。曾参与国家自然科学基金,农业部公益性项目等多个项目的研究工作。目前发表科研论文近20余篇,相关研究成果以第一作者在***Soil Biology Biochemistry、Biology and Fertility of Soils、European Journal of Soil Biology***等土壤学领域著名期刊发表。获本专业相关专利2项。在宏基因组公众号发表《生信小白的福音——免费在线分析扩增子数据SILVAngs》、《功能预测之Tax4Fun》 、《Cytoscape:MCODE增强包的网络模块化分析》等。
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA