疫情期间,很多小伙伴不能去实验室做实验,没有数据,没有图表,心里空落落的~
今天,介绍一个强大的网站,没有实验一样可以搞科研,利用组学大数据看看你心爱的那个蛋白、基因可能参与哪些过程吧!
R2:https://hgserver1.amc.nl/cgi-bin/r2/main.cgi,该网站提供了大量转录组数据集,可以从基因差异表达,相关通路,生存分析等多种层面开展肿瘤信息学基础分析。
TP53是著名的抑癌基因,对于各种类型癌症发生发展发挥重要功能。但是,除了已知的细胞周期等过程外,TP53在肝癌中是否还影响其他过程呢?这里,我们以“TP53在肝癌中相关功能”为例,说明R2网站的用法。
步骤1. 选数据集和方法
点击Change Dataset,网站提供了大量的组学数据集,用户根据需要进行筛选,选择需要的数据集,这里我们选择来源于TCGA数据库的肝癌数据集。
点击View a Gene,下拉框中选择需要的分析方法,为了推测TP53参与调控的其他生物学过程,这里我们选择“Find correlated genes with a single gene”,通过相关性分析识别TP53相关的基因集合;
第4栏Gene输入基因名称: TP53
点击下方“Next”进入下一步
步骤二:参数选择
最简单粗暴的方式就是先保留默认值,不进行任何改动;
其中,值得注意的是,Statistics栏里面默认是Use R
p-value, Yes, 这里我们也可以选择No,然后对应设定相关系数阈值为0.3(系统默认是0.5);
Gene Filters下方GeneCategory(见上图)可以根据研究需要仅仅选取感兴趣的目标基因进行分析,例如当你对你输入的基因可能相关的信号通路感兴趣时,可以选择“Signal transduction”,若对输入基因是否和药物靶标相关,则可以选择“drug target”, 诸如此类。当然,当你完全迷茫,漫无目的时,就简简单单选择“All”。这里我选择“ALL”。
类似地,在KEGG Pathway下方可以选择你感兴趣的通路,例如“Oxidative phosphorylation“。注意,系统对你GeneCategory及KEGG Pathway等Filter的选择会进行交集处理,因此我建议当进行自定义选择时,仅仅就其中一项进行选择,其他默认选择“ALL”。
步骤三:看结果,下图给出了选定肝数据集中TP53与哪些基因相关。
上述结构是与你输入的兴趣基因TP3相关的,相关系数绝对值大于0.3的基因。通常,一个输入基因相关的基因还是蛮多的。
对于这一系列基因,我们可以采用通路富集分析、相互作用网络分析等方式进行功能描述。
R2贴心的提供了这些小工具。
接下来,就可以利用右侧列出的小工具进行下一步分析啦!
选择右侧“Gene set analysis”,
通路富集分析,根据需要选择参数,其中r-min, r-plus代表负相关和正相关,可以单独选择也可以全都选择(系统默认均未选取时代表二者都选择)。
结果如下,相关通路包括: Wnt signaling pathway, Adipocytokine signaling pathway, B cell receptor pathway
其中Genelist中红色标注基因与输入基因间负相关,绿色则表示正相关;
点击通路对应的链接,还可以对每个通路的结果进行可视化展示:
例如,Adipocytokine signaling pathway通路中与TP53相关基因:
接下来,我们想继续探索TP53与PPARA之间的相关性,回到R2网站主页,在分析方法栏选择“Correlated 2 Genes”.
点击“Next”进入参数设定界面,其中Graphics下面的Graphtype可以选择“XY-plot”;
结果以散点图的形式给出该数据集中TP53与PPARA间的相关性;
为了体现线性相关程度,还可以在下方绘图选项中增加一条拟合直线;
然后,点击“Adjust Settings”,稍等片刻,出结果:
该结果说明随着TP53表达量的增加,PPARA的表达量显著下降,暗示着两者间负调控关系;
上述结果是单一数据集的,可能说服力不够,这时我们可以利用多数据集的分析。
回到主页,选项设定如下:
R2功能很是强大,具体的小伙伴们可以参考OnlineTutorial:
R2提供了丰富的生物信息学工具,不需要下载数据,不需要写代码,轻松进行数据分析,为你的研究添砖加瓦。
最后,衷心感谢R2开发者提供了如此功能丰富又免费的软件啊!