R语言与临床模型预测——LASSO回归,单因素多因素cox,差异表达分析,Venn图,森林图,列线图,矫正曲线,ROC全套代码及解析——第六部分 差异表达基因筛选 本专栏可免费答疑

上次我们得到101个预后相关的自噬基因,我们说到基因太多有它的弊端,首先森林图我们没法做,后续用lasso回归可能回答十几甚至几十个基因,基因太多的话容易引起质疑,且难以进行验证。

因此我们需要筛选自噬相关的差异表达基因,然后与101个预后相关基因取交集。

1.下载数据

2. 匹配基因

3. 基因去重复

4.匹配临床数据

5.批量cox回归分析

6.差异表达基因筛选

7.取交集,选出预后相关的差异表达基因

8.森林图绘制

9.lasso回归进一步排除具有共线性的基因

10.验证集验证,数据合并验证

11.多因素cox回归建模

12.列线图

13.矫正曲线

14.ROC曲线分析

下面我们先准备数据:

只需要准备上面两个数据即可,一个是KIRC表达数据,一个是自噬相关基因。

下面我们运行代码,先读取这两个数据:

setwd("D:\\")
dir()
data <- read.csv("KIRC_lcpm.csv",header = T,sep = ",")
ge

你可能感兴趣的:(cox回归临床模型预测,生物信息学,数据挖掘,r语言)