一文看懂火山图

一文看懂火山图

  1. 火山图可用于展示两组样本间基因表达水平差异的分布状况。
  2. 横轴log2 fold change差异表达倍数(Fold Change值,简称FC,根据log2 fold change值的正负判断这些基因的表达量是上升了还是下降了),差异越大的基因分布X轴在两端。
  3. 纵坐标用-log10 p-value表示,对P值进行-log10的转化,-log10(p-value=0.05)约等于1.30,(-log10(0.01))=2,可知纵轴越往上走P值越小,而P值越小表示越显著。所以我们进行-log10(p -value)转化后,值越大就表示差异越显著。
  4. 当然,将横纵坐标换下解读是类似的。

接下来让我们看几张图

123.png

结果解读

  • 上图以|logFC|=0.606且p-value=0.05为截断标准。
  • logFC>0.606且p-value<0.05定义为上调的基因,
  • logFC<-0.606且p-value<0.05定义为上调的基因。
  • 图中红色 的点表示上调的基因,蓝色 的点表示下调的基因,黑点 是无显著差异的基因。
  • 两条红竖线外侧为差异表达倍数为2倍以上的基因。
  • B1横线以上表示p-value<0.05,
  • B2横线以上表示p-value<0.01。
  • 区域1表示|FC|在2倍以内且p-value>0.05,区域2和区域3表示:|FC|>2倍且p-value<0.01的基因。

懂了基础的知识后,就去看看别人是如何描述的吧

案例一

1.png

1.1.png

顺便把他它翻译下:差异表达基因的火山图。Y坐标是|log2(fold change)|,X坐标是−log10(p值)。每个点代表一个基因。红点是显著表达上调的基因。绿点是显著表达下调的基因。黑点是无显著差异的基因。


案例二

下面让我们来看一个“正常一点”的火山图。它的的解读应该就比较简单了!
它在方法中的描述的是:

2.png

它的结果是:

2.1.png


这里有几个细节问题。

问题1:为什么火山图是对称的呢?

通过对logFC值的箱线图可以看出。

3.png

问题2:为什么对P值进行-log10的转化?

转换前后的火山图对比。交互式的火山图可以试试plotly包哦!

4.png


参考来源:

  1. Qiu C C, Su Q S, Zhu S Y, et al. Identification of Potential Biomarkers and Biological Pathways in Juvenile Dermatomyositis Based on miRNA-mRNA Network[J]. BioMed Research International, 2019, 2019.
  2. Lin X D, Wu Y P, Chen S H, et al. Identification of a five‐mRNA signature as a novel potential prognostic biomarker in pediatric Wilms tumor[J]. Molecular genetics & genomic medicine, 2019: e1032.
  3. 感谢jimmy老师在画图以及在处理代码过程中的指导,还有推荐了Rmarkdown这个神器。

你可能感兴趣的:(一文看懂火山图)