小鬼的WGCNA图文详解(七)-eigengene network的可视化

WGCNA图文详解(七)-eigengene network的可视化

还是老习惯,给出官网教程,至于你是看还是不看,它就在那里,等着你的深入研究~

https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/

WGCNA分析图文详解专题中要解释的第六张图,eigengene network的可视化


eigengene network的可视化

关于这个WGCNA图文详解,我们已经讲了6期了。我们通过聚类得到不同的模块之后,那么模块与模块之间是否也存在一定的关系呢?模块与性状之间的关系呢?

图剖依然成以下几个部分:

1,左图a,由模块和性状weight构成的聚类树,右图b,对应a图的热图。两幅图表示的是一个意思,只不过是展示形式不一样(个人感觉右图更直观具体一些)

小面我们来一一解读,如有理解错误还请批评指正。

官方说明1:
Figure 2: Visualization of the eigengene network representing the relationships among the modules and the clinical trait weight. Panel (a) shows a hierarchical clustering dendrogram of the eigengenes in which the dissimilarity of eigengenes EI, EJ is given by 1 − cor(EI; EJ). The heatmap in panel (b) shows the eigengene adjacency AIJ = (1 + cor(EI; EJ))/2.

这里解释了这幅图表示模块与模块,模块与性状weight(体重)之间的关系。

1)图a衡量相似性用的是cor(EI;EJ),即模块I与模块J的eigengene值的相关性,然后用1-cor(EI;EJ)来表示两个模块之间的距离(非相似度),表现在聚类树的高度(y轴的值),高度越短,两个模块越相似(负相关)。

2)图b使用的刻度是 (1 + cor(EI; EJ))/2,这个值越大两个模块越相似(正相关)。

官方说明2:
The eigengene dendrogram and heatmap identify groups of correlated eigengenes termed meta-modules. For example, the dendrogram indicates that red, brown and bluw modules are highly related; their mutual correlations are stronger than their correlations with weight. On the other hand, the salmon module, which is also significantly correlated with weight, is not part of the same meta-module as the red,brown and blue modules, at least if meta-modules are defined as tight custers of modules (for example, modules with a correlation of eigengenes of at least 0.5).

解读:

模块与模块之间高度相关可以形成meta-modules,meta-modules定义的条件是这个超级模块内模块与模块之间的相关性至少要达到0.5。

从这个图可以看出,这里有三个meta-module,如red, brown and blue模块形成了一个meta-modules,它们内部之间的相关性比它们与性状weight体重的相关性还要大。

今天就说到这里,欢迎大家留言讨论。我们图文详解教程总共有7期,今天到这里就在结束了~。图的解说说来说去也就那些意思,这次的重点是下个专题内容的预告:

后面我们针对这个WGCNA还会出一个分析过程详解的专题

包括但不限于以下内容:

1,WGCNA适用于什么分析内容?

2,做WGCNA分析我该使用什么数据,是NGS中基因表达的count值还是FPKM,还是都可以?芯片数据的基因水平的表达值?是否需要log转换?是否需要标准化?

3,我该选取哪些基因进入分析?是全部的基因还是只用差异表达的基因还是经过了某种过滤手段后选取的一部分合理(为什么合理)的基因?

4,多少样本量合适呢?怎么检测异常(离群样本),这些样本是删除还是可以进入后续分析?会给分析结果带来怎样的影响?

5,如何选取softpower,在最初构建softpower的时候取值范围如何选择,用1-20还是什么?为什么?

6,如何选取模块以及模块中的Hub基因?

7,分类变量的表型变量应该如何合理的数值化?

8,......................等等更多精彩解说。

参考资料:
1,https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
2,A General Framework for Weighted Gene Co-Expression Network Analysis, Stat Appl Genet Mol Biol. "Statistical applications in genetics and molecular biology.") 2005;4:Article17. Epub 2005 Aug 12

你可能感兴趣的:(小鬼的WGCNA图文详解(七)-eigengene network的可视化)