机器学习分类结果评判标准-混淆矩阵&ROC曲线

因为在实际中常常遇到失衡数据集的分类问题,在我的译文应对非均衡数据集分类问题的八大策略中,其中一种策略就是改变衡量模型性能的计算方式,那么怎么衡量模型分类性能呢?

有ROC曲线,有混淆矩阵,有对应的实例

ROC曲线,横轴假阳性(样本为负,预测为正),纵轴真阳性(样本为正,预测为正),在每个可能的分类阈值下统计假阳性、真阳性,阈值越大曲线接近(0,0)点,阈值越小曲线趋近(1,1)点;通过AUC值:ROC曲线面积确定分类器性能好坏,AUC面积越大分类性能越好;

常规ROC曲线用于表示二分类分类器性能;对于多分类ROC曲线,采用“one versus all”,假设有三个类别,第一个ROC曲线,确定某一个类别为正,所有其他类别为负,第二三ROC曲线,以此类推,但此时的阈值选取更像商业决策,minimize your False Positive Rate or maximize your True Positive Rate -- 最大化真阳性,最小化假阳性,结合业务具体分析;

你可能感兴趣的:(机器学习算法)