R语言使用boot包进行ROC重抽样获取可信区间并绘图

本人关于重抽样的文章也陆陆续续写了6-7篇,各种类型的都写了一点,本篇文章不在计划内,本来不打算写了。
R语言使用boot包进行ROC重抽样获取可信区间并绘图_第1张图片
但是有些粉丝私信我,觉得使用sample函数重抽样不怎么正规,感觉不是真正的重抽样,要使用boot包才正规,看起来有面子。其实sample函数是R里面最基本的抽样函数,我们很多重要的R包如rms包、proc包都是使用它来重抽样的,sample函数抽样非常简单,而且灵活,等会进行演示。还有些朋友把文章《Boot重抽样获取logistic回归内部验证AUC可信区间》和文章《Boot重抽样获取logistic回归模内部验证AUC并绘制带可信区间的重抽样ROC曲线》搞混了,这两个文章其实抽样还是有点不同的,不能把第一个的方法直接放进第二个里面去,要使用第二个的方法进行取值并绘图(2个同时进行)。
下面我们直接开始,我准备结合上两篇介绍2种方法使用sample函数和boot包分别进行重抽样并绘制roc曲线,并进行比较,算是对本内容的一个总结把。
先说结论,下图是sample函数和boot包分别绘制的重抽样曲线图,boot置信区间稍微宽一点,其他都差不多。
R语言使用boot包进行ROC重抽样获取可信区间并绘图_第2张图片
下面我们就正式进入主题,先做sample函数的,先导入数据和R包

library(pROC)
library(tidyverse)
library(boot)
bc<-read.csv("E:/r/test/buyunzheng.csv",sep=',',header=TRUE)

R语言使用boot包进行ROC重抽样获取可信区间并绘图_第3张图片
这是一个不孕症数据(公众号回复:不孕症,可以获得数据)数据有8个指标,最后两个是PSM匹配结果,我们不用理他,其余六个为:
Education:教育程度,age:年龄,parity产次,induced:人流次数,case:是否不孕,这是结局指标,spontaneous:自然流产次数。
有一些变量是分类变量,我们需要把它转换一下

bc$education<-ifelse(bc$education=="0-5yrs",0,ifelse(bc$education=="6-11yrs",1,2))
bc$spontaneous<-as.factor(bc$spontaneous)
bc$case<-as.factor(bc$case)
bc$induced<-as.factor(bc$induced)
bc$education<-as.factor(bc$education)

#建立模型

本文为转载文章,原文地址如下:https://mp.weixin.qq.com/s?__biz=MzI1NjM3NTE1NQ==&mid=2247487852&idx=1&sn=6e7038f142a7788ee9b78e3cb7427742&chksm=ea26f170dd517866d3361aab741e622a58f2877a0fc5719102343328b623c1918b8b3b41df6f#rd

你可能感兴趣的:(R语言,r语言,开发语言)