k-means、k-means++,核k-means

先说一下欧氏距离
二维空间公式:
在这里插入图片描述
三维空间的公式:
k-means、k-means++,核k-means_第1张图片
n维空间的公式
在这里插入图片描述

经典k-means算法

k-means、k-means++,核k-means_第2张图片
关于聚类中心数目(K值)的选取,方法为:Elbow Method:
通过绘制K-means代价函数与聚类数目K的关系图,选取直线拐点处的K值作为最佳的聚类中心数目。
但最好还是从实际问题出发,人工指定比较合理的K值,通过多次随机初始化聚类中心选取比较满意的结果。

k-means++算法

k-means、k-means++,核k-means_第3张图片
注意:轮盘法。

核k-means算法

核k-means:就是将数据点都投影到了一个高维的特征空间中(为了凸显不同样本中的差异),然后再在这个高维的特征空间中,进行传统的k-means聚类。
输入:所有数据点A,聚类个数k
输出:k个聚类中心点
1:输入数据通过核函数映射到高维空间得到矩阵B
2:对B进行标准k-均值聚类

你可能感兴趣的:(笔记)