[模型评估]五种评估图表(Clementine)

预测值和置信度:

[模型评估]五种评估图表(Clementine)_第1张图片

 

$R-表示预测值,$RC表示置信度,置信度在0-1之间,说明预测值的精准度。

评估图表的工作原理:

根据预测值及预测的置信度排序记录、将记录分割为大小相等的组(分位数)并按由高到低顺序为每个分位数绘制业务标准值。

收益(增益)图表:

收益的定义是相对于全部匹配,发生于每个分位数中的匹配的百分比。其计算方法为(分位数中的匹配数量/全部匹配数量) × 100%

[模型评估]五种评估图表(Clementine)_第2张图片

解读收益图。累积收益图的线从左至右的走势通常是从0% 100%。优秀模型的收益图将陡升至100%,然后保持平直。无法提供有用信息的模型将呈对角线状,即从左下角到右上角(选择了包含基线后将显示类似图表)。

提升图(TGI指数):

提升将每个分位数中匹配记录的百分比与在全部训练数据中匹配的百分比进行比较。其计算方式为(在分位数中的匹配/在分位数中的记录)/(全部匹配/全部记录)。[模型评估]五种评估图表(Clementine)_第3张图片

解读提升图。累积提升图的线从左至右的走势通常为:起始于大于1.0 的值,并渐渐下降,直到接近1.0。图表的右侧边缘表示整个数据集,因此累积分位数的匹配与数据中的匹配的比例为1.0。对于优秀模型的提升图,其线开始于图表左侧大于1.0 的值,且在向右移动的过程中,始终保持在较高的水平;然后,在图表右侧,向1.0的方向迅速下降。如果模型不能提供任何信息,则其线在整个图形中将始终围绕在1.0 左右。(如果选择了包含基线,一条值为1.0 的水平线将显示在图表中供您参考。)

响应图:

响应即分位数中,匹配记录的比例。其计算方式为(分位数中的匹配/分位数中的记录)× 100%

[模型评估]五种评估图表(Clementine)_第4张图片解读响应图。累积响应图通常与提升图极其类似,只在尺度标准方面有所区别。通常,响应图开始于接近100%之处,并逐渐下降,最终将在延伸至图表右侧边缘时达到整体响应率(全部匹配/全部记录)。对于优秀模型的响应图,其线开始于图表左侧接近或等于100% 的值,且在向右移动的过程中,始终保持在较高的水平;然后,在图表右侧,向整体响应率的方向迅速下降。如果模型不能提供任何信息,则其线在整个图形中将始终围绕在整体响应率左右。(如果选择了包含基线,一条值相当于整体响应率的水平线将显示在图表中供您参考。)

利润图:

利润等于每个记录的收入减去该记录的成本。也就是说,分位数的利润就是位于该分位数内的所有记录的利润总和。这里假定收入仅应用于匹配项,但成本可应用于所有的记录。利润及成本都可以是固定的,也可以由数据中的字段决定。其计算方法为(分位数中所有记录收入的总和分位数中所有记录成本的总合)。

例如,如果为每个客户邮寄报价的成本是$0.48,而从接受三个月的订阅的积极响应中获得的收入是$9.95,则每个no 响应将花费$0.48,而每个yes 响应将赚取$9.47(计算方式为9.950.48)。[模型评估]五种评估图表(Clementine)_第5张图片

解读利润图。累积利润图线从左至右的走势代表随着所选样本数量的增加,利润总和的增长。利润图通常开始于0 附近,并在向右延伸的过程中,稳步增长直至在图表中部到达峰值或保持较高的值;随后,在向右侧边缘延伸的过程中,逐渐下降。优秀模型的利润图将在图表中部某处显示定义良好的峰值。而无法提供任何信息的模型,其线相对而言比较平直,也可能由于成本/收入结构的不同增加、降低或保持不变。

投资回报图:

投资回报(ROI) 也需要确定收入和成本,从这一点上来说,它与利润相同。ROI 将分位数的成本和利润进行比较。其计算方法为(分位数利润/分位数成本)× 100%

[模型评估]五种评估图表(Clementine)_第6张图片

解读投资回报图。累积投资回报(ROI) 图通常与响应图及提升图类似,只有在尺度标准方面有所差别。投资回报图通常开始于大于0% 的值,并逐渐下降,直到达到整个数据集的整体ROI(可能为负)。对于优秀模型的投资回报图,其线开始于图表左侧大于0% 的值,且在向右移动的过程中,始终保持在较高的水平;然后,在图表右侧,向整体ROI 的方向迅速下降。如果模型不能提供任何信息,则其线在整个图形中将始终围绕在整体ROI 左右。

 

累积响应图、提升图和投资回报图类似,只是在尺度标准方面有所差别。

 

你可能感兴趣的:(数据挖掘)