Python3 KMeans聚类算法及后续分析

KMeans在sklearn.cluster中:

from sklearn.cluster import KMeans

数据准备:

数据的列为数据的特征数,也就是数据的维度,比如二维数据就是2列,第0列是x轴的数据,另一列是y轴。
以一维数据为例:

data = np.random.rand(100,1)

聚类

首先生成一个迭代器:

estimator = kMeans(n_clusters = 10)

这里聚为10类。

然后开始聚类:

estimator.fit(data)

后续分析

首先是各聚类中心:

centroids = estimator.cluster_centers_

然后是表示原始数据中每个数对应哪个类的label

label_pred = estimator.labels_

你可能感兴趣的:(kips,KMeans)