Stanford 机器学习-clustering

clustering

13.2 K-Means Algorithm

Stanford 机器学习-clustering_第1张图片
输入K和训练集,K代表聚类后的cluster数目。
Stanford 机器学习-clustering_第2张图片
μi 是指第i个聚类中心点,首先随机指定k个聚类的中心。
第一步:对于每个点,选取离这个点最近的中心为该点的分类。
第二步:根据分类后的结果,进行聚类中心 μi 的更新

13.3 Optimization Objective

Stanford 机器学习-clustering_第3张图片
从公式可以看出优化目标就是最小化所有数据与其聚类中心的欧氏距离和。

13.4 Random Initialization

Stanford 机器学习-clustering_第4张图片
随机选取k个点作为中心
Stanford 机器学习-clustering_第5张图片
避免得到局部最优解的办法是:进行多次初始化,多次优化,从中选取最好的结果。

13.5 Choosing the Number of Clusters

可视化,自己选。
Stanford 机器学习-clustering_第6张图片

你可能感兴趣的:(机器学习,clustering)