(1). 扑克牌手动演练k均值聚类过程:>30张牌,3类
第一次选取的聚类中心数:5 、13、8
(2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题)
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.datasets import load_iris
iris = load_iris()
mh=iris.data[:,1]
x=mh.reshape(-1,1)
p = KMeans(n_clusters=3)
p.fit(x) #训练数据
y_kmeans = p.predict(x
plt.scatter(x[:, 0], x[:, 0], c=y_kmeans, s=50, marker=‘.‘,cmap=‘rainbow‘);
plt.show()
(3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.
(4). 鸢尾花完整数据做聚类并用散点图显示.
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.datasets import load_iris
iris = load_iris()
x = iris.data
model = KMeans(n_clusters=3)
model.fit(x)
y = model.predict(x)
print("预测结果:", y)
k = model.cluster_centers_
print("聚类中心:", k)
plt.scatter(x[:, 2], x[:, 3], c=y, s=50, cmap=‘rainbow‘,marker=‘.‘)
plt.show()
(5).想想k均值算法中以用来做什么?
k均值算法是聚类算法,最适合用于分类。例如消费群体的分类,可根据顾客的消费次数,和每次的消费水平来入手,对他们进行群体的划分。