TCGA+biomarker——C-index

通常情况下,通过以下几种指标来对模型进行评价
1)区分度:采用指标C-index和ROC曲线来评价区分度,一般文章都是二选一。

  • C-index即一致性指数(index of concordance),通过评估模型预测结果与实际观察结果的符合程度,以评价模型的预测准确性。
  • ROC曲线,展示特异性和敏感性,ROC曲线下的面积被称为AUC,它介于0.5和1之间,作为数值可以直观的评价分类器的好坏,值越大越好。
    2)校准度:通常采用校准曲线(calibration curve)来进行评价一致性/校准度,即预测值和真实值之间的差异
    3)DCA:决策曲线(DCA)用来帮助确定高风险的患者进行干预、低风险的患者避免过度医疗。

上一期简单介绍了Calibration curve,今天再来说说C-index......

C-index简介

C-index又称C指数,一致性指数(index of concordance),主要用于计算生存分析中的Cox模型预测值与真实之间的区分度(discrimination),也称为Harrell's concordance index ,与ROC曲线的AUC作用类似;在评价肿瘤患者预后模型的预测准确性中用的比较多。

C-index案例

简单检索了下pubmed上关于c-index的展示方式,发现形式很多样,柱状图、箱体图、森林图等等。

  • 不同模型c-index的柱状图展示
image
  • 不同模型(不同生存类型)c-index的箱体图展示
image
  • 不同模型的c-index的森林图形式展示
image

C-index的结果解释

image

解释:C-index取值范围在0.5-1之间,C-index=0.5时,完全不一致,说明该模型没有预测作用;C-index=1时,完全一致,说明该模型预测结果与实际完全一致;C-index在0.50-0.70范围时,为较低准确度;C-index在,0.70-0.90范围时,为中等准确度;C-index在,>0.90时,则为高准确度。如上图,分别在两个数据集中计算两种模型的C-index,结果均在0.7以上,说明两个模型的准确性还是不错的。此外,模型2是在模型1的基础上添加了Histoliogic grade因素,模型2的C-index值有所提升,说明Histoliogic grade因素的加入有利于提高模型的准确性。

C-index的绘制

本文主要讲解Cox回归中的C-Statistics(一般称为C-index)的计算。严格说来C-index包括以下几种,这里仅介绍临床上较为常用的第一种Harrell's concordance index。经查询,计算C-index的R函数有很多,这里以比较简单且易于理解的survival包为例,首先用survival包中函数coxph()构建cox模型,其结果返回值就包含了C-index和标准误信息,95%可信区间就可以通过C-index加减1.96*se得到。

library(survival) #加载survival包
data(lung)    #加载内置数据
fit = coxph(Surv(time, status) ~ age+sex, data = lung) #建模
sum.surv = summary(fit)
c_index_se = sum.surv$concordance
# C-index
c_index = c_index_se[1]
# C-index的95%置信区间
c_index.ci_low = c_index - c_index_se[2]*1.96
c_index.ci_hig = c_index + c_index_se[2]*1.96

更多C-index计算方法可参考:
https://blog.csdn.net/fjsd155/article/details/84669331

往期回顾
TCGA+biomarker——常见结果展示
TCGA+biomarker——Sample基线表
TCGA+biomarker——单因素Cox回归
TCGA+biomarker——多因素Cox回归
TCGA+biomarker——Cox回归森林图
TCGA+biomarker——Calibration curve

更多内容可关注公共号“YJY技能修炼”~~~

你可能感兴趣的:(TCGA+biomarker——C-index)