数据集:使用sklearn自带的iris数据集,该数据集包含某种花类的观察数据,包括四个特征,花有三类。
①导入要用到的包:
from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
from sklearn.cluster import KMeans
②导入数据集:
iris = datasets.load_iris()
特征值数据存储在iris.data中,标签在iris.target中:
③实现KNN:
neigh = KNeighborsClassifier(n_neighbors = 3)
neigh.fit(iris.data,iris.target)
print("预测结果:"+str(neigh.predict([[5,3,5,2]]))) #预测
④实现KMeans:
kmeans = KMeans(n_clusters = 3,random_state = 0).fit(iris.data)
print("kemeans:"+str(kmeans.labels_)) #打印聚类结果
print("target:"+str(iris.target)) #打印数据集标签进行对比
结果:
借助sklearn实现一些简单的机器学习算法非常方便,但是要了解其中原理还是要花一些时间的!