每天五分钟机器学习:聚类算法中经常使用的肘部法则是什么?

本文重点

如何选择聚类的数目K,也就是说我们要将数据聚成几簇。我们可以通过可视化的方式(画图),或者聚类算法的输出结果(试一试)来手动的决定聚类的数目,或者根据实际需要来确定我们想要聚成几簇,比如前面的衣服问题。

肘部法则

对于肘部法则,我们所需要做的是改变 k 值,也就是聚类类别的数量。我们对不同的k来计算代价函数,我们可以会得到这样的一条曲线:

每天五分钟机器学习:聚类算法中经常使用的肘部法则是什么?_第1张图片

 

这条曲线我们可以清楚的看到有一个肘点,所以我们选择K=3(因为K=3之后损失降低的慢了),但是有些时候可能我们得到的曲线是这样的:

每天五分钟机器学习:聚类算法中经常使用的肘部法则是什么?_第2张图片

 

这个没有明确的肘点,而是相对比较光滑的,所以这样的话,我们的肘部法则就没有办法使用了。所以肘部法则不能保证所有情况都能有用。

你可能感兴趣的:(每天五分钟玩转机器学习算法,聚类,机器学习,算法,人工智能,数据挖掘)