8.使用单值衡量指标 翻译自 吴恩达新书-Machine Learning Yearning

更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费.

举个例子,分类准确率就是一个单值衡量指标(在开发数据集或测试数据集上,运行你的分类器,分类器会返回一个单一数值,即分类正确的样本比例)。依据这个衡量标准,分类算法A的准确率为97%,分类算法B的准确率为90%,此时,我们任务算法A更好一些。

相反,查准率(Precision)和查全率(Recall)就不是一个单一的衡量指标,它返回了两个用于评估模型的数值。当衡量指标有多个数值时,就比较难区分出哪个算法更好了,比如:
8.使用单值衡量指标 翻译自 吴恩达新书-Machine Learning Yearning_第1张图片
没法看出哪个分类算法更好,因此你也就没有办法立即选择其中的一个了。
在这里插入图片描述
在开发阶段,你的团队会尝试很多想法,比如改变算法结构、更新模型参数、选择其他特征等等。当建立一个单值衡量标准(比如使用准确率作为衡量标准)后,可以依据这个衡量标准,快速找出表现最好的模型。

如果你非常关心查准率和查全率,我建议你将这两个数值合并成一个数值。比如可以使用查准率和产权率的平均值,作为最终的衡量指标。或者你可以计算“F1得分”(查准率和查全率的加权平均值)。
8.使用单值衡量指标 翻译自 吴恩达新书-Machine Learning Yearning_第2张图片

使用单一衡量指标可以让你从大量分类模型中,迅速的找到合适的一个。它可以给出一个非常清晰的排序,从而加快你的开发进程。

最后,假如你在跟踪分类器四个关键市场的准确率:美国、中国、印度和其他。这会产生四个准确率,通过计算平均值或加权平均值,你可以将这四个数值合并成一个数值。平均或加权平均的方法,是将多个指标合并成一个指标最常用的方法。

更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费.

你可能感兴趣的:(吴恩达-YEARNING)