Python实现KMeans聚类

from sklearn import datasets  #加载数据包
from sklearn.cluster import KMeans  #加载KMeans
from sklearn import cross_validation #加载交叉检验,然后处理数据

data=datasets.load_iris()
x=data.data
y=data.target

x_train,x_test,y_train,y_test=cross_validation.train_test_split(x,y,test_size=0.25,
                                            random_state=0,stratify=y)

clu=KMeans(n_clusters=3)  #建立模型,选择分成三类
clu.fit(x_train)        #训练模型
y_=clu.predict(x_test[:10]) #测试
y_test[:10]   #真实结果

'''
y_
Out[23]: array([0, 0, 0, 0, 2, 2, 2, 0, 2, 1])

y_test[:10]
Out[24]: array([0, 0, 0, 0, 1, 1, 1, 0, 1, 2])

从输出结果中可以看出,KMeans效果还是不错的,都聚成了一类
'''

你可能感兴趣的:(机器学习,Python)