KNN-1 python 实现

#coding=utf-8  
from numpy  import *
import operator
#创建数据集
def createDataSet():
    group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels=['A','A','B','B']
    return group,labels
#KNN算法实现
def knn_classify0(inx,dataSet,labels,k):
    #inx 用于分类的输入向量
    #dataSet 输入的训练样本集
    #标签 labels
    #k 最近邻居的数目
    dataSetSize= dataSet.shape[0]
    #tile函数是重复函数
    diffmat = tile(inx, (dataSetSize,1)) - dataSet 
    sqdiffmat = diffmat**2
    #对数组按行求和
    sqdistance = sqdiffmat.sum(axis=1)
    distance=sqdistance**0.5
    #对数组按列排序,返回索引值
    sortedDisIndex = distance.argsort(axis=0)
    #建立字典
    classCount={}
    for i in range(k):
        votelabel=labels[sortedDisIndex[i]]
        #字典的get方法(a,b),如果字典里没有此key返回b,有返回key_value。不断的累积标签对应的数值
        classCount[votelabel]=classCount.get(votelabel,0)+1
    sortedclassCount=sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)
    return sortedclassCount[0][0]

group,label=createDataSet()
result0=knn_classify0([2,2], group, label, 3)
print result0       
        
        
        
        
        
        
        
        
    

你可能感兴趣的:(ML)