基于Logistic回归的列线图
1. 引用R包1 #install.packages("rms")
2 library(rms) #引用rms包
2. 读取文件1 setwd("C:\Users\000\Desktop\09_Nomogram") #设置工作目录
2 rt
3 head(rt) #查看数据集rt▲ 在该数据集中,主要包含了年龄(Age),性别(Gender),BMI值,教育水平(Education),饮酒史(Alcohol)5个自变量,以及1个结局变量(Status)。
3. 设置变量参数
首先,根据分组情况,对所有的变量添加标签1 rt$Age =60"))
2 rt$Gender
3 rt$BMI
4 rt$Education
5 rt$Alcohol
6 options(datadist = "ddist")
4. 构建Logistic模型1 fit
2 #利用lrm()函数对模型进行拟合
3 fit #查看模型拟合结果
结果如下:
在模型中,纳入所有的变量构建了Logistic模型,结果展示了每个变量在模型中的系数以及P值,而且模型的C指数为0.839,展示出模型良好的预测能力。
5.构建Nomogram及可视化
使用nomogram()函数构建模型1 nom
2 fun.at=c(0.0001,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,0.9999),
3 lp=F,
4 funlabel="Risk of hypertension") #构建Nomogram图
5 plot(nom) #输出Nomogram图
结果如下:
通过将每个指标对应的Points相加,与Total points相对应,即可获得不同患者的患病可能性,并且可以提前对高危的患者进行针对性的干预。
基于Cox回归的列线图
与Logistic回归的列线图一致,首先便是数据的读取与整理过程。
1.引用R包1 library(rms)
2 library(foreign)
3 library(survival)
2.读取文件1 setwd("C:\Users\000\Desktop\09_Nomogram") #设置工作目录
2 rt2
3 head(rt2) #查看数据集rt2
3.设置变量参数1 rt2$gender
2 rt2$stage
3 rt2$T
4 rt2$M
5 rt2$N
6 rt2$risk
7
8 ddist
9 options(datadist='ddist')
4.构建Cox回归模型1 f
2 x=T, y=T, surv=T,
3 data=rt2, time.inc=1)
4 surv " />
5.构建Nomogram及可视化1 nom2
2 fun=list(function(x) surv(1, x), function(x) surv(2, x), function(x) surv(3, x)),
3 lp=F,
4 funlabel=c("1-year survival", "2-year survival", "3-year survival"),
5 maxscale=100,fun.at=c(0.99, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3,0.2,0.1,0.05)) #构建Nomogram图
6 plot(nom2) #输出Nomogram图
结果如下:
在模型中,共纳入了6个变量,通过整合,预测患者1年,2年以及3年的预后生存情况。
ps:代码在知乎转码过程中可能出错,有需要可移步Nomogram图不会画?看了这篇,小白也能轻松看懂搞定 paste
在日常的临床工作以及研究中,对于某个疾病,无论是肿瘤研究,还是非肿瘤研究,我们常听到患者提出这样的问题,“我的检查结果是这样的,那么最终患病的概率有多少,生存情况又是怎样的呢”。当然,生信分析,作为医学研究的三大主线之一,亦是如此,最终的结局无外乎两种,一是发病率是多少,二是预后生存情况如何。
当我们通过数据挖掘,或者模型构建,发现了一种新的Biomarker,或者风险模型,除了通过ROC曲线或者生存分析评估其对疾病进展或者预后的独立预测能力以外,另一种很重要的手段就是该分子变量与其他已有的临床病理特征结合,综合预测患病率或生存率模型的重要能力。如果我们能提前预测病人病情的进展情况,那么有时候将会做出不同的临床决定,使整个过程更偏向个性化治疗。
Nomogram图,又称为列线图,是基于多因素分析的结果,将多个预测指标进行整合,根据一定的比例分配,以图形的形式将各个变量之间对结局预测之间相互关系进行可视化展示。
希望对大家有所帮助