【深度学习: C-统计量】C-统计量:定义、示例、权重和显著性

【深度学习: C-统计量】C-统计量:定义、示例、权重和显著性

    • 什么是 C 统计量?
    • 权重
    • 统计显著性

什么是 C 统计量?

【深度学习: C-统计量】C-统计量:定义、示例、权重和显著性_第1张图片

一致性统计量等于ROC曲线下的面积。

c统计量(有时称为“一致性”统计量或c指数)是对逻辑回归模型中二元结果的拟合优度的度量。在临床研究中,c -统计量给出了随机选择的经历过某一事件(如疾病或状况)的患者比没有经历过该事件的患者具有更高风险评分的概率。它等于受试者工作特征(ROC)曲线下的面积,取值范围为0 ~ 1。

  • 值低于0.5表示模型非常差。
  • 值为0.5意味着模型的预测结果并不比随机机会好。
  • 值超过0.7表示模型良好。
  • 超过0.8的值表示强模型。
  • 值为1意味着该模型完美地预测了哪些群体成员将经历某种结果,哪些不会。

c统计量并不常用,因为它只能给你一个关于模型的一般概念;ROC曲线包含更多关于准确性、敏感性和特异性的信息。

权重

当无法预测阳性结果(如癌症检测)的成本高于正确预测阴性结果的收益时,使用加权c指数。加权会惩罚导致正面和负面结果的小概率差异的模型,但不会改变c统计量的值。它也可以用来调整分层随机抽样。

统计显著性

与大多数统计数据一样,c统计数据有时与置信区间配对。例如,结果可能为0.63,置信区间从0.53到0.73)。一般来说,任何包含0.5的结果都是不显著的,即使它包含了相关的c统计量。例如,CI范围从0.43到0.83的0.63结果并不显著,因为它在该范围内包含0.5。

你可能感兴趣的:(深度学习知识专栏,深度学习,人工智能)