差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下

了解火山图

在组学中,火山图(Volcano plot)常用于展示蛋白(或基因)的表达差异。差异表达的蛋白可以通过综合两个指标来获得:变化倍数(fold-change)与假设检验的p值。在火山图中,横坐标为Log2 fold-change,越偏离中心差异倍数越大;纵轴为-Log10(p-value)(通常采用调整后的p值, 即p-adjust),沿纵轴的数值越大差异越显著。很多差异表达的蛋白差异倍数大、显著性也强,因此呈现火山喷发的形状。

常见的火山图为直角筛选形式,通常设置固定的p值和固定的变化倍数作为筛选差异蛋白的阈值,构成两个“直角”的筛选区间。而下方的火山图则采用曲线方程y > curvature / |x-"Log2FoldChangeCutOff"| + "-Log10pValueCutOff",构成更为平滑的筛选区间。曲线筛选不仅“颜值高”,而且滤去了大量堆积在“直角”处同时具有较低-Log10(p-value)和较低幅度变化的点,提高结论可信度。

差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下_第1张图片

画曲线筛选火山图分几步?

R语言画火山图需要以下几个步骤:1) 导入数据,按实验分组将数据拆分为两部分。2) 用lapply()函数结合t.test()参数检验或wilcox.text()非参数检验计算p值。3) 对于高维度组学数据,用p.adjust()函数校正p值。4) 用lapply()函数计算组间变化倍数。5) 依据筛选曲线方程计算显著变化的特征,给这些特征加上颜色标签。6) 用ggplot2画散点图,并给打上标签的特征填上颜色,再根据方程画出筛选曲线。

听起来有点复杂?小编为了实现这些步骤写了快150行代码,还是比较耗时间的。

有没有更便捷的方法?

当然!我们把上面的方法包成了一个Shiny小应用,从此搞定华华丽丽的差异表达火山图只需要三步:1) 打开小应用;2) 把数据装进去;3) 收割火山图。

差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下_第2张图片

手把手教程首先,准备两个数据表,数据矩阵和分组信息。数据矩阵由特征(如蛋白)列表和每个样本中各个特征的丰度数据组成,分组信息则包括样本名称和该样本所在的分组。

差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下_第3张图片

接下来,打开https://shiny.imetalab.ca/Volcano_plot/,在首页提示下分别上传两个表格。

差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下_第4张图片

上传好表格后,右侧会显示上传的表格供检查,并弹出数据上传正确的提示。

差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下_第5张图片

如果数据没有预处理也没关系,数据上传成功后,下方会出现提示,可选择是否先进行数据处理,包括选择特定的行、列,过滤,插值,对数转换,归一化等。如果数据不需要处理,可直接进入分析界面。

差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下_第6张图片

进入分析界面后,系统会按默认设置自动计算变化倍数和假设检验,并生成一个初始的火山图。接下来,可以调整各个参数,如下:

差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下_第7张图片

还有高级设置界面,让你的火山图独一无二:

差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下_第8张图片

最后,可以下载结果表格,包括p值,变化倍数,以及是否是差异蛋白、上调/下调,便于后续分析。

差异表达基因变化倍数_差异表达分析:高颜值火山图轻松拿下_第9张图片

欢迎关注https://shiny.imetalab.ca,宏蛋白质组学最常用的分析,我们“包”了。

你可能感兴趣的:(差异表达基因变化倍数)