k-means和kd-tree简明教程推荐


看到一个非常好的k-means和kd-tree教程,简洁直观,值得推荐,来自以色列学者Dan Pelleg的主页:

http://www.pelleg.org/shared/hp/kmeans.html


Dan Pelleg和CMU数据挖掘大牛Andrew Moore在1999年发表“Accelerating exact k-means with geometric reasoning”,目前被引用超过250次。他们在2000年提出X-means, 优点是不用预先指定k的个数,对于大规模数据具有很好的效率,缺点是only empirically demonstrated X-means on up to four-dimensional data,也就是适用于低维数据。不过很适用于图像数据聚类中,因为图像通常用3个色彩空间的数据表示,至多加上2个坐标,也就是5维数据。


下文的算法与上述两种相似,都是使用kd-tree来加速k-means。

Tapas Kanungo, David M. Mount, Nathan S. Netanyahu, Christine D. Piatko, Ruth Silverman, and Angela Y. Wu. An efficient k-means clustering algorithm:Analysis and implementation. IEEE Trans. PatternAnal. Mach. Intell., 24(7):881–892, 2002.


,以色列的希伯来文字看起来真逆天...

你可能感兴趣的:(k-means和kd-tree简明教程推荐)