机器学习策略

评价指标

机器学习策略_第1张图片

查准率(precision)和查全率(recall)

翻译很贴近它要表达的意思
恩达举的例子
查准率的定义是在你的分类器标记为猫的例子中,有多少真的是猫。所以如果分类器A有95%的查准率,这意味着你的分类器说这图有猫的时候,有95%的机会真的是猫

查全率就是,对于所有真猫的图片,你的分类器正确识别出了多少百分比。实际为猫的图片中,有多少被系统识别出来?如果分类器A查全率是90%,这意味着对于所有的图像,比如说你的开发集都是真的猫图,分类器A准确地分辨出了其中的90%。

机器学习策略_第2张图片

当我们使用这两个指标不能很好判断一个模型的好坏,我们就要使用f值去判断,你可以把它看做这两个指标的一个均值,当然这不是严格意义上的均值。

训练/开发/测试集划分(Train/dev/test distributions)

training set:顾名思义,是用来训练模型的。因此它占了所有数据的绝大部分。
development set:用来对训练集训练出来的模型进行测试,通过测试结果来不断地优化模型。
test set:在训练结束后对训练出的模型进行一次最终的评估所用的数据集。

所有数据随机洗牌,放入开发集和测试集,保证我们的数据来自于同一个分布。

开发集和测试集大小的划分

小数据集(几千个样本或者有一万个样本):训练集、测试集三七分;训练集、开发集和测试集六六二

大数据集(百万级):98%作为训练集,1%开发集,1%测试集

你可能感兴趣的:(深度学习,机器学习)