谱聚类时间复杂度和空间复杂度分别是 O(n3)和 O(n2),为了减少谱聚类的计算量,主要的方法有:减少需要计算的顶点数和边数方法,降维。
D. Yan, L. Huang and M. I. Jordan. Fast approximate spectral clustering. 15th ACM Conf. Knowl. Discov. Data Mining (SIGKDD), 2009:907–916.
该算法主要包括数据的预聚类和谱聚类两个阶段,在数据预聚类阶段,首先利用 K-MEANS 算法对数据集进行预处理聚类,形成过分割的球形小簇。第二阶段利用每个球形小簇的中心点作为代表点形成代表点样本空间输入谱聚类中,最后代表点的类别标签与被代表点的相同。
Nyström 算法:
通过使用少量样本间的相似度估计整个数据集所有数据相似度的技术。
方法存在以下不足:
1)所需内存资源较多,例如当数据集规模是 100000 的时候,它的内存需求是 6GB。
2)样本选取具有随机性,聚类结果不稳定。
基于分块技术的图像分割算法:
首先将一副图像(称为原图像)分割成独立较小的图像,并对每个小图像进行初始划分;然后对各个小图像的初始划分进行融合,之后在融合的每一个划分中随机选取一
个点,并将选取的这些点构成原图像的特征数据;最后,利用谱聚类方法对这些特征数据进行聚类,并根据特征数据的聚类结果,确定原图像中每个像素点所属的类别。提出
的算法主要由图像分块、初始预分割、特征数据的聚类以及确定原图像中像素的类别四部分组成。
图像分块:
目的是把一副大尺寸的图像分次调入内存处理,增强算法的适用性,避免过大图像处理不了的问题。大尺寸图像被分块后,减少了每次运算的数据量和计算压力。
初始预分割:
对分块后的每个独立的小图像进行初始划分,然后从每个小图像的初始划分中选择一个划分作为基准,不失一般性,将第一个小图像的初始划分作为基准,对其余的小图像的划分与基准划分进行比较:若小图像的划分与基准划分具有相同灰度,则将小图像的划分对应的像素归到基准划分;若在基准划分中未出现小图像划分中像素点的类别,则产生一种新的划分,并将其加入到基准划分中,通过此种方法将会形成整幅图像的一个初始划分 C=[c1,c2,…,cn]。
特征数据的聚类:
从每个 ci中随机选取一个像素点 i,并将该点所在原图像的灰度值xi 作为谱聚类中的一个输入对象,假设按照此方法获得的数据(称为特征数据)为 X=[x1,x2,…,xn]。利用谱聚类算法 NJW 对特征数据 X 聚类,设聚类结果为 V,其中 V 中的每个元素为输入向量 xi的类标记,由这些类标记组成的向量为V=[v1,v2,…,vn],vi∈{1,2,…,k},其中k 是要分割的类别数。
确定原图像中像素的类别:
设 xj的类别标记为 vi,且 xj所在的划分为 cj,将 cj中所有的像素点归到与 xj相同的类别中,从而获得原图像的分割结果。
下面给出详细的图像分割算法:
步骤 1 图像分块将图像 I 分解为 b 个小图像 I1,I2,…,Ib,其中 b 代表所分的块数;
步骤 2 初始预分割
步骤 5 确定图像中每个像素点的分割结果