学习:StatQuest-K-means

前言

K-means属于动态聚类,聚类速度较快,难点是不太好找到初始凝聚点

K-means

image.png

第一步,我们的K代表的是你要聚成几类,譬如K=3即分成3类


image.png

第二步就是选择初始凝聚点,譬如K=3则选取3个,但这三个类来自3个类(根据经验选,选的好不好看命了)
第三步,数轴上每个点与这三个初始凝聚点计算距离


image.png

第四步,根据距离分类
第五步,划分好类以后,计算每个类的均值
image.png

第六步,将每个均值当作凝聚点再重复上述步骤

聚类结束

那么什么时候聚类结束呢?一般三个类里面的数据点数量相当的时候,就差不多结束了


image.png

第二个聚类是最佳聚类,显然每个类的数据点都比较相当

你可能感兴趣的:(学习:StatQuest-K-means)