风险评估热图

风险评估热图_第1张图片

在画这个图之前我们先来了解一些这类文章的研究思路。一般先寻找差异表达基因,然后通过Cox回归分析寻找跟生存显著相关的基因。然后基于这些跟生存显著相关的基因,利用LASSO Cox回归构建风险评估模型,计算风险分值。【1】

风险评估热图_第2张图片

研究思路图

一般计算风险分值的公式为

风险评估热图_第3张图片

其中Ei为模型中第i个基因的表达值,而βi为LASSO计算出来的系数。

得到了风险分值之后,我们就可以来画图了。根据上面Risk score公式,我们可以计算出每一个样本的Risk score,那么图A就很容易画了,就是根据所有样本的风险分值,从低到高排序,然后用散点图展示出来。取所有样本risk score的中值作为cutoff,就可以将样本分成高风险和低风险两组了。

图B根据图A的样本顺序,将每个样本的生存时间用散点图展示出来,用不同的颜色来表示样本的生存状态。从图B中可以看出,大部分高风险组的样本已经死亡了。也进一步验证了,构建的这个风险模型是靠谱的。

图C就是把构成这

你可能感兴趣的:(生信,java,随机森林)