基于原型的聚类

9.2 基于原型的聚类

基于原型的聚类,簇是对象的集合,其中任何对象离定义该簇的原型比离定义其他簇的原型更加接近。

9.2.1 模糊聚类

1.模糊集合:允许对象以0和1之间的某一个隶属度属于某一个集合
2.模糊簇:权值之和为1,每个簇至少包含一个非零权值点
3.模糊c均值:k均值的模糊版本(fcm)
基于原型的聚类_第1张图片
计算SSE误差平方和
在这里插入图片描述
初始化:随机初始化
计算质心:最小化SSE来推导出质心:
在这里插入图片描述
更新模糊伪划分,更新点和簇相关联的权值
在这里插入图片描述
p=2:
在这里插入图片描述

9.2.2 使用混合模型的聚类

基于统计模型的聚类
1.混合模型
将数据看做从不同的概率分布得到的观测值的集合
2.使用最大似然估计模型参数
3.使用最大似然函数估计混合模型参数:EM算法
基于原型的聚类_第2张图片
EM算法类比K均值算法:
期望步对应于K均值将每个对象指派到每个簇的步骤,但将每个对象以及某一概率指派到每个分布;最大化步对应于计算簇质心,但是选取分布的所有参数以及权值参数来最大化似然。
例子:
基于原型的聚类_第3张图片
基于原型的聚类_第4张图片

9.2.3 自组织映射

自组织特征映射SOM是一种基于神经网络观点的聚类和可视化技术。
1.SOM算法
SOM的显著特征是它赋予质心一种空间组织
基于原型的聚类_第5张图片

你可能感兴趣的:(数据挖掘导论)