【机器学习】一文弄懂k-means算法原理

问题

k-means算法可以说是机器学习中大家最耳熟能详也是最基础的聚类算法,面试中也常常被问起,由浅至深,没有扎实的理论基础是很难过得了这一关的,因此,我们必须得梳理梳理并且深入理解它。

k-means算法简介

● k-means是一种聚类算法。所谓的聚类,就是指在不知道任何样本的标签的情况下,通过数据之间的内在关系将样本分成若干个类别,使得相同类别样本之间的相似度高,不同类别之间的样本相似度低。因此,k-means算法属于非监督学习的范畴。

● k 是指 k 个簇(cluster),means 是指每个簇内的样本均值,也就是聚类中心。

● 基本思想:通过迭代的方式寻找 k 个簇的划分方案,使得聚类结果对应的代价函数最小。代价函数可以定义为各个样本距离它所属的簇的中心点的误差平方和:
J ( c , μ ) = ∑ i 

你可能感兴趣的:(机器学习,算法,kmeans)