[机器学习] K-means 客户分群实战

K-means

概念

K-means算法是一种无监督学习的聚类算法,也叫做K均值聚类,通过均值的计算,对样本分为K个不同的簇。
[机器学习] K-means 客户分群实战_第1张图片

距离度量

使用K-means算法时,样本的距离度量必须满足一定的条件:
[机器学习] K-means 客户分群实战_第2张图片
对样本属性的距离度量计算时,可以采取不同的距离度量公式,
[机器学习] K-means 客户分群实战_第3张图片
k-means一般采用p=2时,也就是欧式距离。

迭代计算

在进行聚类时,要先确定簇的个数k,然后进行下面操作:

  1. 指定k个簇的初始化中心C1,C2,C3…Ck。 ( b )
  2. 求每个样本到各个中心的距离,并将其划分到距离最小的中心的簇中。( c )
  3. 对划分的每个簇重新计算簇中心。( d )
  4. 如果簇中心发生变化则回到第2步 ( e ),否则达到迭代次数或者中心变化幅度过低可认为完成聚类退出。( f )
    [机器学习] K-means 客户分群实战_第4张图片
    [机器学习] K-means 客户分群实战_第5张图片

聚类评估方法

簇内平方和

[机器学习] K-means 客户分群实战_第6张图片
簇内平方和会随着k的增加而降低,所以对于k的选取则需要采取一定的策略,肘部法则
[机器学习] K-means 客户分群实战_第7张图片

轮廓系数

[机器学习] K-means 客户分群实战_第8张图片

特点

[机器学习] K-means 客户分群实战_第9张图片

使用

[机器学习] K-means 客户分群实战_第10张图片
[机器学习] K-means 客户分群实战_第11张图片

实战开发

[机器学习] K-means 客户分群实战_第12张图片
下面介绍需要使用到的工具:

华为云 ModelArts

[机器学习] K-means 客户分群实战_第13张图片

Jupyter Notebook

[机器学习] K-means 客户分群实战_第14张图片

OBS对象存储

[机器学习] K-means 客户分群实战_第15张图片
[机器学习] K-means 客户分群实战_第16张图片

实操

[机器学习] K-means 客户分群实战_第17张图片

环境搭建

[机器学习] K-means 客户分群实战_第18张图片

数据同步

[机器学习] K-means 客户分群实战_第19张图片

数据导入

[机器学习] K-means 客户分群实战_第20张图片

数据预处理

[机器学习] K-means 客户分群实战_第21张图片

K值的选择

[机器学习] K-means 客户分群实战_第22张图片

模型的构建

[机器学习] K-means 客户分群实战_第23张图片

模型的使用

[机器学习] K-means 客户分群实战_第24张图片

结果可视化

[机器学习] K-means 客户分群实战_第25张图片

你可能感兴趣的:(机器学习专栏,聚类,机器学习,算法)