Spark 机器学习 —— KMeans

创建模型所对应的类及模型训练

import org.apache.spark.mllib.clustering.KMeans
val kmeans = new KMeans()
val model = kmeans.run(data)
            # 要求 data 的类型为 RDD[Vector]

显示模型训练的结果

model.clusterCenters.foreach(println)
                # 聚类中心(仍然为特征向量)

预测(model.predict)

model.predict(feat)

你可能感兴趣的:(Spark 机器学习 —— KMeans)