决策曲线分析法(Decision Curve Analysis,DCA)是个与ROC曲线相提并论的相对比较新的模型评价方法。
关于它的原理,长篇大论的医学统计学知识解读实在不是我的强项,放上两个链接偷偷懒:
https://www.plob.org/article/12455.html https://www.iikx.com/news/statistics/1622.html
如果想看文章,这篇里的fig7就是:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8051731/。
图的横坐标为阈概率(ThresholdProbability)。当各种评价方法达到某个值时,患者i的出血风险概率记为Pi;当Pi达某个阈值(记为Pt),就界定为阳性,采取某种干预措施。纵坐标就是利减去弊之后的净获益率。
简单说这个图片怎么看,曲线接近两条参考线的模型,说明没有应用价值,在很大一个阈值区间内高于参考线的,说明模型好一些。
下面是DCA曲线的绘制方法
只能用于logistic回归,图片风格略古老
rm(list = ls())
library(rmda)
data(dcaData)
set.seed(123)
baseline.model <- decision_curve(Cancer~Age + Female + Smokes,
data = dcaData,
thresholds = seq(0, .4, by = .005),
bootstraps = 10)
#plot using the defaults
plot_decision_curve(baseline.model,
curve.names = "model1",
cost.benefit.axis =FALSE,
#col= c('red','blue'),
confidence.intervals=FALSE,
standardize = FALSE)
去年8月份的包,支持logistic回归和cox回归,简洁易用,图片基于ggplot2,可以非常方便的修改。
library(ggDCA)
library(rms)
m1 <- lrm(status~ANLN,LIRI)
data <- dca(m1)
ggplot(data)
m2 <- lrm(status~ANLN+CENPA,LIRI)
data <- dca(m1,m2)
ggplot(data)
m1 <- cph(Surv(time,status)~ANLN,LIRI)
data <- dca(m1)
ggplot(data)
m2 <- cph(Surv(time,status)~ANLN+CENPA,LIRI)
data <- dca(m1,m2)
ggplot(data,linetype = T)
o的k!多说一句,ggDCA这个包的作者是一棵树,作者亲手写的教程是在:https://mp.weixin.qq.com/s/dcN1BvmuSO7osWFPPq3pYg 供大家参考。