sklearn代码4 3-KNN手写数字的识别

import numpy as np

import cv2

import matplotlib.pyplot as plt
%matplotlib inline

from sklearn.neighbors import KNeighborsClassifier
# bitmap 位图
digit = cv2.imread('./u=123514531,1306365842&fm=26&fmt=auto.bmp')

plt.imshow(digit)

# 将(三维的)彩色图片转换为黑白的(图片灰度化处理):大大降低数据量
digit = cv2.cvtColor(digit,code = cv2.COLOR_BGR2GRAY)

# (391,500,3)  -----> (391,500)
# 数据量减少,只有原来的1/3
# 
digit.shape
(391, 500)

sklearn代码4 3-KNN手写数字的识别_第1张图片

X = []
for i in range(1,3):
    for j in range(1,7):
        digit = cv2.imread('./data/%d/%d.bmp'%(i,j))
        X.append(digit[:,:,0])
X = np.asarray(X) #numpy对象
y = np.array([i for i in range(2)]*6)
y.sort()
X.shape  #一共有12个图片
(12,)

加载数据 处理(灰度化)

# digit二维的,高度,维度,像素(只有一个值)-----用什么颜色表示呢
# 选择黑白,图片show就是黑白,rainbow显示出来,彩虹效果

index = np.random.randint(1,12,size = 1)[0]    #在这12个图片中随机选取

digit = X[index]


print('-----------------------------',y[index])

plt.imshow(digit,cmap=plt.cm.gray)
----------------------------- 1






sklearn代码4 3-KNN手写数字的识别_第2张图片

X,y划分成训练和验证数据

# 模型选择 可以打乱顺序 按照比例进行划分
from sklearn.model_selection import train_test_split
# test_size = 0.2 则 train_size = 0.8
# 训练:测试 = 4:1
# 划分完之后依旧是一一对应
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.2, random_state = 100)
y_train.shape
(9,)

算法训练和预测(验证)

# 数据不合要求,reshape形状改变
# 数据不变
# 三维数据---------->变作两维
X_train = X_train.reshape(9,-1)   # -1 倒着数
X_train.shape
(9, 1)
9**0.5
3.0

你可能感兴趣的:(python,scikit-learn模块,sklearn,python,人工智能)