本文通过python+sklearn,实现人脸识别。
我们这次筛选的数据来自sklearn的datasets的fetch_olivetti_faces
from sklearn import datasets
faces = datasets.fetch_olivetti_faces()
通过faces.images就是人脸对应的图像数组,我们先来看下shape:
print(faces.images.shape)
(400, 64, 64)
一共是400张64X64的图片。
我们通过matplotlib来显示出这些图片到一张图中:
from matplotlib import pyplot as plt
i = 0
plt.figure(figsize=(20, 20))
for img in faces.images:
#总共400张图,把图像分割成20X20
plt.subplot(20, 20, i+1)
plt.imshow(img, cmap="gray")
#关闭x,y轴显示
plt.xticks([])
plt.yticks([])
plt.xlabel(faces.target[i])
i = i + 1
plt.show()
看到对应的图片:
从图中可以看到,每个人有10个头像,对应的人脸标签是从0-39,一共40种人脸。
了解了数据后,我们准备好特征数据和对应标签
#人脸数据
X = faces.data
#人脸对应的标签
y = faces.target
print(X[0])
print(y[0])
[0.30991736 0.3677686 0.41735536 ... 0.15289256 0.16115703 0.1570248 ]
0
每个data对应的是已经经过处理的4096像素点(64x64)数据
每个target对应人脸的标签
随机分割30%的数据做测试验证的数据
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
首先从数据上看,是属于分类行为,所以我们用到sklearn的Classifier。
我这里选取了 SVM, 并且使用linear作为核函数。
from sklearn.svm import SVC
#使用SVC作为模型
clf = SVC(kernel="linear")
#训练
clf.fit(X_train, y_train)
#预测
y_predict = clf.predict(X_test)
#对比实际值
print("实际标签:", y_test[0], "预测标签:", y_predict[0])
实际标签: 14 预测标签: 14
预测准确。
对多标签分类任务的模型进行评分,一般使用accuracy_score
from sklearn.metrics import accuracy_score
print(accuracy_score(y_test, y_predict))
0.9333333333333333
得分比较接近1,说明模型较好,人脸识别率高
我们刚才用了核函数为linear的SVM得到了很高的评分, 那其他模型是否也具有很高的评分呢?
可以通过字典的方式,多模型同时评测:
# 选几个分类的机器学习模型做回归
estimators = {"knn classifier": KNeighborsClassifier(),
"svc kernel=rbf classifier": SVC(),
"svc kernel=linear classifier": SVC(kernel="linear"),
"randomforest classifier": RandomForestClassifier(n_estimators=10, max_depth=10)}
#
for key, estimator in estimators.items():
estimator.fit(X_train, y_train)
y_predict = estimator.predict(X_test)
print(key, ":", accuracy_score(y_test, y_predict))
svc kernel=linear classifier : 0.9583333333333334
randomforest classifier : 0.525
knn classifier : 0.7916666666666666
svc kernel=rbf classifier : 0.05
可以看到还是SVM kernel=linear时,得分最高。还有很多分类算法, 可以自己尝试。
好了, 本次讲了人脸识别的实操,除去图形显示,没有多少代码量,但对于很多理论知识,像SVM,以及SVM的核函数有哪些,有什么区别,还是要靠自己学习和深挖。
附上一张SVM核函数介绍图: