python机器学习sklearn实现人脸识别

本文通过python+sklearn,实现人脸识别。

数据准备

我们这次筛选的数据来自sklearn的datasets的fetch_olivetti_faces

from sklearn import datasets

faces = datasets.fetch_olivetti_faces()

通过faces.images就是人脸对应的图像数组,我们先来看下shape:

print(faces.images.shape)
(400, 64, 64)

一共是400张64X64的图片。
我们通过matplotlib来显示出这些图片到一张图中:

from matplotlib import pyplot as plt

i = 0
plt.figure(figsize=(20, 20))
for img in faces.images:
    #总共400张图,把图像分割成20X20
    plt.subplot(20, 20, i+1)
    plt.imshow(img, cmap="gray")
    #关闭x,y轴显示
    plt.xticks([])
    plt.yticks([])
    plt.xlabel(faces.target[i])
    i = i + 1

plt.show()

看到对应的图片:

从图中可以看到,每个人有10个头像,对应的人脸标签是从0-39,一共40种人脸。

了解了数据后,我们准备好特征数据和对应标签

#人脸数据
X = faces.data
#人脸对应的标签
y = faces.target
print(X[0])
print(y[0])
[0.30991736 0.3677686  0.41735536 ... 0.15289256 0.16115703 0.1570248 ]
0

每个data对应的是已经经过处理的4096像素点(64x64)数据
每个target对应人脸的标签

训练测试数据分离

随机分割30%的数据做测试验证的数据

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

模型选择

首先从数据上看,是属于分类行为,所以我们用到sklearn的Classifier。
我这里选取了 SVM, 并且使用linear作为核函数。

from sklearn.svm import SVC

#使用SVC作为模型
clf = SVC(kernel="linear")
#训练
clf.fit(X_train, y_train)
#预测
y_predict = clf.predict(X_test)
#对比实际值
print("实际标签:", y_test[0], "预测标签:", y_predict[0])
实际标签: 14 预测标签: 14

预测准确。

模型评分

对多标签分类任务的模型进行评分,一般使用accuracy_score

from sklearn.metrics import accuracy_score

print(accuracy_score(y_test, y_predict))
0.9333333333333333

得分比较接近1,说明模型较好,人脸识别率高

扩展:多模型同时测评

我们刚才用了核函数为linear的SVM得到了很高的评分, 那其他模型是否也具有很高的评分呢?
可以通过字典的方式,多模型同时评测:

# 选几个分类的机器学习模型做回归
estimators = {"knn classifier": KNeighborsClassifier(),
              "svc kernel=rbf classifier": SVC(),
              "svc kernel=linear classifier": SVC(kernel="linear"),
              "randomforest classifier": RandomForestClassifier(n_estimators=10, max_depth=10)}
#
for key, estimator in estimators.items():
    estimator.fit(X_train, y_train)
    y_predict = estimator.predict(X_test)
    print(key, ":", accuracy_score(y_test, y_predict))

svc kernel=linear classifier : 0.9583333333333334
randomforest classifier : 0.525
knn classifier : 0.7916666666666666
svc kernel=rbf classifier : 0.05

可以看到还是SVM kernel=linear时,得分最高。还有很多分类算法, 可以自己尝试。

总结

好了, 本次讲了人脸识别的实操,除去图形显示,没有多少代码量,但对于很多理论知识,像SVM,以及SVM的核函数有哪些,有什么区别,还是要靠自己学习和深挖。
附上一张SVM核函数介绍图:
python机器学习sklearn实现人脸识别_第1张图片

你可能感兴趣的:(ML,sklearn,机器学习,人脸识别,python)