FEKM: fast and extract out-of-core k-means clustering

;;Kmeans的时间复杂度是O(m)(《数据挖掘导论》,m是数据规模)。但是,算法在每次迭代过程中需要计算每个点到各个质心的距离,于是距离函数需要被计算km次,k是质心个数,而计算欧氏距离的过程如果看成是求一个n次多项式的函数值的过程,就算运用秦九韶算法也需要n次乘法和n次加法。当数据规模很大甚至作为核外数据集时,这显然是不能接受的。;;前人的许多研究都围绕近似展开,以牺牲准确度为代价来加速算法。这篇文章提出的FEKM算 ...

你可能感兴趣的:(cluster)