临床上,因变量和临床的结局有时候不是线性关系,而回归模型有一个重要的假设就是自变量和因变量呈线性关联,因此非线性关系模型用回归分析来拟合受到限制。因此,一个更好的解决方法是拟合自变量与因变量之间的非线性关系,限制性立方样条(Restricted cubic spline,RCS)就是分析非线性关系的最常见的方法之一。
最近有粉丝问有序多分类变量可以应用在限制立方条图吗?是可以的。我们可以通过分组可视化来显示数据的差异性。
需要用到splines、rms、ggplot2这三个包,要先下载好,
首先加载包和导入我们的数据:
library(ggplot2)
library(splines)
library(rms)
be<-read.csv("E:/r/test/qztp2.csv",sep=',',header=TRUE)
names(be)
model.spline <- lm(be$Gestational.week ~ rcs(be$HB))#建立样条回归
summary(model.spline)
注意这个P值,小于0.05表明非线性关系
使用anova(model.spline)来查看也是一样的
然后使用ggplot2画图
ggplot(be, aes(HB, Gestational.week)) +
geom_point()+
stat_smooth(method = lm, formula = y ~ rcs(x,4)) ##绘制样条回归拟合效果图
model.spline1 <- lm(be$Gestational.week ~ rcs(be$HB, c(20,100,126,150)))#建立样条回归,设置4个节点
ggplot(be, aes(HB, Gestational.week)) +
geom_point()+
stat_smooth(method = lm, formula = y ~ rcs(x, c(20,100,126,150))) ##绘制样条回归拟合效果图
ggplot(be, aes(HB, Gestational.week,fill=Prenatal.hemorrhage,size=Prenatal.hemorrhage1)) +
geom_point(shape=21,size=4,col="black")+
stat_smooth(method = lm, formula = y ~ rcs(x,4)) ##美化一下图形
加入我们想知道有出血和没有出血两个分类指标对结果Y的影响,我们可以加入分组变量,从颜色深浅可以感知出血量多少,目前看两个变量可信区间几乎重合,是否出血对结果应该没影响,聚体还要看模型指标。
ggplot(be, aes(HB, Gestational.week,group=Prenatal.hemorrhage,fill=Prenatal.hemorrhage1)) +
geom_point(shape=21,size=4,col="black")+
stat_smooth(method = lm, formula = y ~ rcs(x,4)) ##分组表示