GEO数据挖掘小尝试:(二)蛋白质互作网络分析

在上一篇文章《GEO数据挖掘:(一)寻找共同差异基因》中我们通过两个实验的数据寻找到了一些差异基因,本篇文章将对这些差异基因的互作关系进行简单的分析,用到的工具主要有String和Cytoscape.

1、利用String进行蛋白互作网络分析

STRING是蛋白质相互作用数据库,可用来分析已知蛋白之间和预测蛋白质之间相互作用。
这里我们是分析多个蛋白质之间的互作关系,如上图依次进行操作:
(1)选择输入选项--Multiple proteins;
(2)选择输入文件,也可复制所有基因粘贴到上面的输入框中;
(3)选择物种,这里选择人类;
(4)点击SEARCH进行搜索分析。
进入主页,如下图,这里既可以输入一个蛋白分析其与已知蛋白质之间的联系,还可以输入多个蛋白分析他们之间的互作关系。

GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第1张图片
输入文件

搜索分析后会出现多个结果,一般选择默认的直接点击 continue即可,如下:
GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第2张图片
continue

最后便会出现我们输入基因的检索结果:
GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第3张图片
检索结果

上面展示了默认的蛋白互作网络图,通过下方的settings选项,我们可以设置建立互作关系的阈值以及网络图中边线表示的意义:
(1)evidence:不同颜色的线表示不同证据;
(2)confidence:两个蛋白质相互作用越强连线越粗;
(3)actions:不同颜色和形状的线表示不同的作用。
其中各种不同边线表示的意思可以在Legend中进行查看。
在Analysis中可以查看GO和KEGG通路分析结果,但在这里没有发现KEGG分析结果:
GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第4张图片
通路分析

点击下方的download下载GO分析结果。
在Exports选项中可以根据自己的需要导出网络图以及表示网络中各个节点关系的文本文件。
这里我们导出存有各基因关系的tsv文件和互作网络图。
GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第5张图片
互作网络图

2、利用cytoscape绘制蛋白互作网络

利用从String中导出的蛋白互作关系文件在cytoscape中绘制网络图。

2.1 简介

先简单的介绍一下cytoscape的界面:


GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第6张图片
主界面

其中较为值得注意的是菜单栏的select和网络处理面板。select可用来简单的挑选子网络,而网络处理面板则是对网络进行相关的设置:

(1)network:包括所有创建的网络,可以选择相应的网络进行操作
(2)style:属性(node/edge/network)

  • Node:对点进行设置,包括:点的形状、颜色、大小;点边界线的类型、颜色、宽度;点标签的颜色、大小;点背景色的透明度等
  • Edge:对边进行设置,包括:边的类型、颜色、宽度;目标处箭头类型等。
  • Network:对网络整体属性进行设置,包括:背景标题等
    (3) Select:面板用于筛选符合特定标准的边
2.2 生成初始网络互作图

导入tab分隔文件(这里为string中导出的tsv文件),生成网络互作图:


GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第7张图片
生成网络图

选择好文件打开后,会出现下面的界面,表示哪些列的信息会在我们绘图中用到。第一列一般表示source gene,第二列则表示target gene,表示关系则为source与target相连。后面的多列可用来表示相关的一些附加信息,映射(map)到网络图形元素(如形状大小、线条粗细、颜色等),非必须信息。这里我们只用前两列,因此需要把后面的多列都给禁用掉。


GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第8张图片
选择信息

最后点击ok便会生出网络图:
GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第9张图片
初始网络图

可以看到这个网络图与string中生成的网络图是一致的。
可以用鼠标选择节点移动,还可以通过ctrl+鼠标进行选择多个节点一起移动使网络图看起来更美观。

2.3 网络图美化以附加信息的可视化

美化网络主要在style选项,如下:


GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第10张图片
美化网络

style中各个图形参数除了可以直接指定外还可以进行映射(map),也就是将附加信息在各个图形元素上反映出来,下面将先会先对网络图进行分析,然后将node degree映射到节点大小上。

Degree:指的是有多少节点与我直接相连,也就是与我距离为1,有一条边直接相连的邻居,对于有向图中要分为出度和入度,从名字就可以看出差别,出度数是从我这个节点指向别的节点边的条数,入度数指的邻居节点有边与我相连,并且方向是指向我这个节点的边的条数。
Betweenness centrality:指的是图中有路劲相连的两个节点这样的边中有多少条边经过本节点,也就是说这个计算的是它处在其他节点相连路劲中间的比例。
closeness:计算的是到图中其他节点的距离总和比较小,这个更接近与中心度,计算的是这个节点处于图中间位置的程度。

作者:lemondy
链接:https://www.zhihu.com/question/22610633/answer/89577479
来源:知乎

先对网络图进行分析,依次点击Tools->NetworkAnalyzer->Network Analysis->Analyze Network,生成统计分析结果如下:


GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第11张图片
网络分析结果

接下来我们将,Node degree统计结果映射到节点大小上面:


GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第12张图片
统计映射

除了大小外,颜色也可进行映射。另一个较为有用的映射是蛋白间上调、抑制关系的映射,这种一般需要提前将信息放在输入文件中。
2.5 提取子网络

对于做好的网络图提取子网络既可以直接通过工具栏中的select选项来进行选择所需节点,还可以使用插件MCODE来分析得到子网络。在Apps中可直接安装MCODE。
这个分析主要能够帮我们发现在network中联系更紧密的群组或者基因。安装好后在Apps中打开MCODE,一般使用默认参数来生成子网络即可:

GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第13张图片

GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第14张图片
MCODE生成子网络

在结果框中可以看到我们的分析结果,包括得分以及其他信息。

3、GO、KEGG富集分析

最后,我们再使用David来对差异基因做个富集分析。网址:https://david.ncifcrf.gov/summary.jsp

GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第15张图片
提交基因列表

提交后,会转到list项页面,选择物种进行分析:
GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第16张图片
选择物种

GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第17张图片
选择显示导出通路信息

下载通路注释文件:
GEO数据挖掘小尝试:(二)蛋白质互作网络分析_第18张图片
导出通路注释文件

最后,看看下载的文件是什么样子把:
image.png

可以看到对每个基因都有相关通路的详细注释。

你可能感兴趣的:(GEO数据挖掘小尝试:(二)蛋白质互作网络分析)