人脸识别经典算法实现(一)——特征脸法

转自:https://blog.csdn.net/freedom098/article/details/52088064

近来想要做一做人脸识别相关的内容,主要是想集成一个系统,看到opencv已经集成了三种性能较好的算法,但是还是想自己动手试一下,毕竟算法都比较初级。

操作环境:python2.7

第三方库:opencv for python、numpy

第一种比较经典的算法就是特征脸法,本质上其实就是PCA降维,这种算法的基本思路是,把二维的图像先灰度化,转化为一通道的图像,之后再把它首尾相接转化为一个列向量,假设图像大小是20*20的,那么这个向量就是400维,理论上讲组织成一个向量,就可以应用任何机器学习算法了,但是维度太高算法复杂度也会随之升高,所以需要使用PCA算法降维,然后使用简单排序或者KNN都可以。

只当搬运工,送上链接。

PCA,,这篇博客讲得非常好了,从原理到实现基本看这个就能搞出来了:http://blog.codinglabs.org/articles/pca-tutorial.html

特征脸法:PCA应用在人脸识别当中:http://blog.csdn.net/smartempire/article/details/21406005,这里与PCA有不同的操作就是特征值分解的时候,由于图像组成的列向量维度太高,直接按照PCA算法求解会很慢,所以这里有一种特殊的处理方法。

数据组织形式为若干样本图片分类放入对应文件夹中,然后在统一存放入face文件夹下,测试图像单独一张图像即可。

另外,由于PCA中维度是一个很麻烦的事情,所以在程序中,我打印了很多维度信息,有助于我们理解PCA的工作过程和调试。

代码如下:

 

 
  1. #encoding=utf-8

  2. import numpy as np

  3. import cv2

  4. import os

  5.  
  6. class EigenFace(object):

  7. def __init__(self,threshold,dimNum,dsize):

  8. self.threshold = threshold # 阈值暂未使用

  9. self.dimNum = dimNum

  10. self.dsize = dsize

  11.  
  12. def loadImg(self,fileName,dsize):

  13. '''

  14. 载入图像,灰度化处理,统一尺寸,直方图均衡化

  15. :param fileName: 图像文件名

  16. :param dsize: 统一尺寸大小。元组形式

  17. :return: 图像矩阵

  18. '''

  19. img = cv2.imread(fileName)

  20. retImg = cv2.resize(img,dsize)

  21. retImg = cv2.cvtColor(retImg,cv2.COLOR_RGB2GRAY)

  22. retImg = cv2.equalizeHist(retImg)

  23. # cv2.imshow('img',retImg)

  24. # cv2.waitKey()

  25. return retImg

  26.  
  27.  
  28. def createImgMat(self,dirName):

  29. '''

  30. 生成图像样本矩阵,组织形式为行为属性,列为样本

  31. :param dirName: 包含训练数据集的图像文件夹路径

  32. :return: 样本矩阵,标签矩阵

  33. '''

  34. dataMat = np.zeros((10,1))

  35. label = []

  36. for parent,dirnames,filenames in os.walk(dirName):

  37. # print parent

  38. # print dirnames

  39. # print filenames

  40. index = 0

  41. for dirname in dirnames:

  42. for subParent,subDirName,subFilenames in os.walk(parent+'/'+dirname):

  43. for filename in subFilenames:

  44. img = self.loadImg(subParent+'/'+filename,self.dsize)

  45. tempImg = np.reshape(img,(-1,1))

  46. if index == 0 :

  47. dataMat = tempImg

  48. else:

  49. dataMat = np.column_stack((dataMat,tempImg))

  50. label.append(subParent+'/'+filename)

  51. index += 1

  52. return dataMat,label

  53.  
  54.  
  55. def PCA(self,dataMat,dimNum):

  56. '''

  57. PCA函数,用于数据降维

  58. :param dataMat: 样本矩阵

  59. :param dimNum: 降维后的目标维度

  60. :return: 降维后的样本矩阵和变换矩阵

  61. '''

  62. # 均值化矩阵

  63. meanMat = np.mat(np.mean(dataMat,1)).T

  64. print '平均值矩阵维度',meanMat.shape

  65. diffMat = dataMat-meanMat

  66. # 求协方差矩阵,由于样本维度远远大于样本数目,所以不直接求协方差矩阵,采用下面的方法

  67. covMat = (diffMat.T*diffMat)/float(diffMat.shape[1]) # 归一化

  68. #covMat2 = np.cov(dataMat,bias=True)

  69. #print '基本方法计算协方差矩阵为',covMat2

  70. print '协方差矩阵维度',covMat.shape

  71. eigVals, eigVects = np.linalg.eig(np.mat(covMat))

  72. print '特征向量维度',eigVects.shape

  73. print '特征值',eigVals

  74. eigVects = diffMat*eigVects

  75. eigValInd = np.argsort(eigVals)

  76. eigValInd = eigValInd[::-1]

  77. eigValInd = eigValInd[:dimNum] # 取出指定个数的前n大的特征值

  78. print '选取的特征值',eigValInd

  79. eigVects = eigVects/np.linalg.norm(eigVects,axis=0) #归一化特征向量

  80. redEigVects = eigVects[:,eigValInd]

  81. print '选取的特征向量',redEigVects.shape

  82. print '均值矩阵维度',diffMat.shape

  83. lowMat = redEigVects.T*diffMat

  84. print '低维矩阵维度',lowMat.shape

  85. return lowMat,redEigVects

  86.  
  87. def compare(self,dataMat,testImg,label):

  88. '''

  89. 比较函数,这里只是用了最简单的欧氏距离比较,还可以使用KNN等方法,如需修改修改此处即可

  90. :param dataMat: 样本矩阵

  91. :param testImg: 测试图像矩阵,最原始形式

  92. :param label: 标签矩阵

  93. :return: 与测试图片最相近的图像文件名

  94. '''

  95. testImg = cv2.resize(testImg,self.dsize)

  96. testImg = cv2.cvtColor(testImg,cv2.COLOR_RGB2GRAY)

  97. testImg = np.reshape(testImg,(-1,1))

  98. lowMat,redVects = self.PCA(dataMat,self.dimNum)

  99. testImg = redVects.T*testImg

  100. print '检测样本变换后的维度',testImg.shape

  101. disList = []

  102. testVec = np.reshape(testImg,(1,-1))

  103. for sample in lowMat.T:

  104. disList.append(np.linalg.norm(testVec-sample))

  105. print disList

  106. sortIndex = np.argsort(disList)

  107. return label[sortIndex[0]]

  108.  
  109.  
  110. def predict(self,dirName,testFileName):

  111. '''

  112. 预测函数

  113. :param dirName: 包含训练数据集的文件夹路径

  114. :param testFileName: 测试图像文件名

  115. :return: 预测结果

  116. '''

  117. testImg = cv2.imread(testFileName)

  118. dataMat,label = self.createImgMat(dirName)

  119. print '加载图片标签',label

  120. ans = self.compare(dataMat,testImg,label)

  121. return ans

  122.  
  123.  
  124. if __name__ == '__main__':

  125. eigenface = EigenFace(20,50,(50,50))

  126. print eigenface.predict('d:/face','D:/face_test/1.bmp')

  127.  
  128.  

你可能感兴趣的:(人脸识别)