机器学习实战学习笔记7——Kmeans

1.Kmeans算法概述

1.1 Kmeans算法介绍

Kmeans是发现给定数据集的K个簇的算法。簇个数K是用户给定的,每一个簇通过其质心,即簇中所有点的中心来描述。

1.2 Kmeans算法工作流程

(1)创建K个质点作为起始质心;
(2)当任意一个点的簇分配结果发生改变时:
对数据集中的每个数据点
对每个质心
计算质心与数据点之间的距离
将数据点分配到距其最近的簇
对每一个簇,计算簇中所有点的均值并将均值作为质心

1.3 Kmeans算法优缺点

(1)优点:容易实现
(2)缺点:可能收敛到局部最小值,在规模数据集上收敛较慢
(3)应用领域:图片分割、商品归类、客户分类

2.Kmeans算法实现

你可能感兴趣的:(python学习笔记,机器学习)