模糊C均值聚类(FCM)算法概述

梳理学习使用

tips:论述理论,暂未添加实现代码。

模糊C均值聚类(FCM)起源于C均值聚类(HCM,K-means)聚类。
一些教学资料中讲述 HCM比较多,属于硬性聚类划分: 一个元素x只有属于或者不属于某个类Ci两种情况

FCM是柔性的划分:一个元素x属于某个类Ci的隶属度(或者称之为概率)为ui(u∈[0,1]),比较x属于不同的类隶属度大小确定所属C,并且,x对于c个类的隶属度之和为1,即u1+u2+...+uc=1。


所以可以求得隶属度矩阵即可判断x属于哪个C,例如

隶属度矩阵示例
0.2 0.75 0.91 0.3 0.18
0.3 0.15 0.02 0.18 0.12
0.5 0.1 0.07 0.52 0.7

隶属度矩阵U={uij},维度3*5,表示5个元素分为3个类,其中第一个元素x1属于三个类C1、C2、C3的隶属度(第一列)分别为0.2,0.3,0.5。


显而易见,如果有n个元素待分为m个类:
n个隶属度约束函数:对于第一个元素u11+u12+...+u1c=1、对于第二个元素u21+u22+...+u2c=1……

一个价值函数(称之为度量聚类函数、目标函数):        ,自然语言就是说求所有元素到所有聚类中心的“距离”之和,可以认为价值函数表示的是聚类结果的分散性大小,所以越小越好。

FCM聚类实质上就是在满足隶属度约束函数情况下,计算价值函数最小值。学过高数条件极值就明白该怎么计算了:利用拉格朗日条件极值解法。

FCM可以分为两部分:求类中心及价值函数和迭代。


(未完)



你可能感兴趣的:(个人学习,MATLAB代码)