matlab 子空间聚类算法,子空间聚类算法DOC

DOC(Density-Based Optimal Projective Clustering)算法同时使用了自底向上的网格策略和自顶向下的迭代改善簇质量的策略。该算法引入了最佳投影簇的概念,可将投影簇看成一个二元组(C,D),其中C是一定数量的数据对象所组成的一个子集,D是其相关维的子集。

算法的目标就是找到一个这样的组合(C,D),使在集合C中的点在D中属性维所张成的空间中有成为一个簇的趋势。为了实现该目标,算法定义了一个区别集X,它包含少量的原始数据,这个区别集的主要目的是可以判别一个簇的相关维。可以通过随机抽样方法建立了这样的规模较小的子集X。

给定一个簇对(C,D),使得点p在集合C内,点q在集合X内,以下表达式成立:

对维集D中的每一维集均有:\[|q_i-p_i|\le w\]其中W是结果簇或网格的直径,由用户指定,而P和X都是随机获得的。

算法不断重复以上过程以得到最好的结果。

DOC需要三个参数,w指定结果簇或网格的直径;\(\alpha\)指定一个簇所需要的最

少点数,它和w一起限定了簇的最小密度;参数B∈(0,1]用来确定子空间大

小和簇大小的相对重要性,DOC算法聚类结果严重依赖参数的值,其形状一般是

超矩形的,所花的时间与数据集中对象的数量呈线性关系而与维度的数量呈指

数关系。

欢迎加入我爱机器学习QQ14群:336582044

微信扫一扫,关注我爱机器学习公众号

你可能感兴趣的:(matlab,子空间聚类算法)