机器学习算法一之基于K均值聚类算法实现数据聚类及二维图像像素分割

K均值聚类算法

1.含义及原理

K均值(k-means)聚类算法,顾名思义首先给定K个初始均值作为聚类中心,然后通过分析其他n-k个点同K个聚类中心的距离进行分类,然后对集群求取新的均值作为聚类中心,由此迭代,知道K个不同类别之间的类间距离满足设定阈值条件为止,可应用于一维数据分析和语义分割场景

算法原理及过程:
输入:n个样本的集合
输出:样本集合的聚类
过程:
(1)初始化。随机选择k的样本作为初始聚类的中心。
(2)对样本进行聚类。针对初始化时选择的聚类中心,计算所有样本到每个中心的距离,默认欧式距离,将每个样本聚集到与其最近的中心的类中,构成聚类结果。
(3)计算聚类后的类中心,计算每个类的质心,即每个类中样本的均值,作为新的类中心。
(4)然后重新执行步骤(2)(3),直到聚类结果不再发生改变。

K均值聚类算法的时间复杂度是O(nmk),n表示样本个数,m表示样本维数,k表示类别个数。
机器学习算法一之基于K均值聚类算法实现数据聚类及二维图像像素分割_第1张图片

2.一维数据进行K均值聚类处理

来自百度百科:

你可能感兴趣的:(机器学习算法,#,Python,-,opencv,人工智能,聚类,算法,均值算法,机器学习,python)