一条R命令搞定风险评估散点图和热图

相信很多人在一些预后模型相关文章中都看到过下面这样的图。

在画这个图之前我们先来了解一些这类文章的研究思路。一般先寻找差异表达基因,然后通过Cox回归分析寻找跟生存显著相关的基因。然后基于这些跟生存显著相关的基因,利用LASSO Cox回归构建风险评估模型,计算风险分值。【1】

研究思路图

一般计算风险分值的公式为

其中Ei为模型中第i个基因的表达值,而βi为LASSO计算出来的系数。

得到了风险分值之后,我们就可以来画图了。根据上面Risk score公式,我们可以计算出每一个样本的Risk score,那么图A就很容易画了,就是根据所有样本的风险分值,从低到高排序,然后用散点图展示出来。取所有样本risk score的中值作为cutoff,就可以将样本分成高风险和低风险两组了。

图B根据图A的样本顺序,将每个样本的生存时间用散点图展示出来,用不同的颜色来表示样本的生存状态。从图B中可以看出,大部分高风险组的样本已经死亡了。也进一步验证了,构建的这个风险模型是靠谱的。

图C就是把构成这个风险模型的所有基因在不同样本中的表达情况用热图展示出来。

那么以往的方法是分别画出这三张图,然后把它们拼接起来,相当麻烦。今天小编给大家介绍一个R包,一条命令就可以一次性画出上面三张图。具体参考下文

一条R命令搞定风险评估散点图和热图

参考文献:

1.A ten-gene signature-based risk assessment model predicts the prognosis of lung adenocarcinoma

你可能感兴趣的:(一条R命令搞定风险评估散点图和热图)