# Logistic regression中的threshold

Logistic regression中的threshold

参考

[1] https://developers.google.com/machine-learning/crash-course/classification/thresholding

逻辑回归返回的是一个概率。您可以“原样”使用返回的概率(例如:用户点击此广告的概率为0.00023),也可以将返回的概率转换成二元值(例如,这封电子邮件是垃圾邮件)。

如果某个逻辑回归模型对某封电子邮件进行预测时返回的概率是0.9995,则表示该模型预测这封邮件非常可能是垃圾邮件。相反,在同一个逻辑回归模型中预测分数为0.0003的另一封电子邮件很可能不是垃圾邮件。可是如果某封电子邮件的预测分数为0.6呢?为了将逻辑回归值映射到二元类别,您必须制定分类阈值classification threshold(也称为判定阈值decision threshold)

如果值高于该阈值,则表示垃圾邮件。如果值低于该阈值,则表示非垃圾邮件。人们往往会认为分类阈值应该始终为0.5, 但是阈值取决于具体问题,因此您必须对其进行调整。

我会在后面的部分中详细介绍可用于对分类模型进行评估的指标,以及更改分类阈值对这些评估指标的影响。
注意:“调整”逻辑回归的阈值不同于调整学习率等超参数。在选择阈值时,需要评估您将因犯错而承担多大的后果。例如,将非垃圾邮件误标记为垃圾邮件会非常糟糕。不过,虽然将垃圾邮件误标记为非垃圾邮件会令人不快,但是应该不会让您丢掉工作。

你可能感兴趣的:(DeepLearning)