OpenCV之kNN

 kNN就是k-Nearest Neighbour,属于比较简单的监督分类方法。

说白了就是预测对象的最近的k个邻居进行投票,哪种多就属于哪一类。一般就是拿欧式距离来判断远近,k值一般为奇数个,改进的kNN还会对远近不同的邻居设置不同的投票权重,进而得到更准确的结果。

虽然手动实现也比较简单,OpenCV中ml库里已有提供的KNearest_create(),直接拿来玩一玩。

这里用的是二维点,那么二维点本身的坐标就是该点的特征,如果要是用于其他场景上则关键问题是数据特征的提取与转化,输入的则是一个n维向量,类别可能也有多种,就需要在参数设置上做出一些适当的调整。

import cv2
import numpy as np
import matplotlib.pyplot as plt
# 随机产生25个二维点,x、y范围是0到99
trainData = np.random.randint(0,100,(25,2)).astype(np.float32)
#产生25个一维标签,非0即1
labels = np.random.randint(0,2,(25,1)).astype(np.float32)
# 根据标签分离数据
red = trainData[labels.ravel()==0]
blue = trainData[labels.ravel()==1]
plt.scatter(red[:,0],red[:,1],80,'r','^')
plt.scatter(blue[:,0],blue[:,1],80,'b','s')
#新造一个点
newcomer = np.random.randint(0,100,(1,2)).astype(np.float32)
plt.scatter(newcomer[:,0],newcomer[:,1],80,'g','o')
#用knn来训练预测结果
knn = cv2.ml.KNearest_create()
knn.train(trainData,cv2.ml.ROW_SAMPLE,labels)
#用周边3个进行投票
ret, results, neighbours ,dist = knn.findNearest(newcomer, 3)
print ("result: ", results,"\n")
print ("neighbours: ", neighbours,"\n")
print ("distance: ", dist)
plt.show()

 我的生成图像如下:

 OpenCV之kNN_第1张图片

 

你可能感兴趣的:(机器学习,数字图像处理)