Spark2.0机器学习系列之8: 聚类(k-means,Bisecting k-means,Streaming k-means)
在Spark2.0版本中(不是基于RDDAPI的MLlib),共有四种聚类方法:(1)K-means(2)LatentDirichletallocation(LDA)(3)Bisectingk-means(二分k均值算法)(4)GaussianMixtureModel(GMM)。基于RDDAPI的MLLib中,共有六种聚类方法:(1)K-means(2)Gaussianmixture(3)Powe