在看论文改进PCA_LDA的人脸识别算法研究_马帅旗和https://blog.csdn.net/xiaomage_gf/article/details/61631293
上写的LDA人脸识别算法,加载人脸库的函数没贴出来,其他的都有了。大概整理了两天时间写出的。
# -*- coding: utf-8 -*-
'''9/8/6 LDA的Freset人脸库
算法步骤,将图像转为列向量,计算全局平均图像,每一类的平均图像,
计算类间,类内的协方差矩阵,计算投影矩阵;分类器识别'''
import os
import numpy as np
import cv2
import sys
from lbp2D.pca import (loadFre)#库函数的
import math
def getLDALie(data,k):
D,V =np.linalg.eig(data) #特征值与特征向量 #200*200的
DIndex=np.argsort(-D)#将D的索引从大到小排序
VIndex=DIndex[0:k]#因为是列的,所以是前N个
V1=V[:,VIndex]#(800, 77)
return V1
def getPCALie(Z,Threshold):
'''平均脸'''
T1 = Z*Z.T #使用矩阵计算,所以前面mat
D,V =np.linalg.eig(T1) #特征值与特征向量 #200*200的
DIndex=np.argsort(-D)#将D的索引从大到小排序
lenD=len(DIndex)
k=0
for j in range(lenD):
temp_DInd_I=DIndex[:j]
if(D[temp_DInd_I]/D.sum()).sum()>=Threshold:
k=len(temp_DInd_I)
break
print(k)
VIndex=DIndex[0:k]#因为是列的,所以是前N个
V1=V[:,VIndex]#(800, 77)
V1 = Z.T*V1 #(6400, 77)
'''
for i in range(k): #特征向量归一化
L = np.linalg.norm(V1[:,i])#默认是平方之后和求根 2范数 也就是模
V1[:,i] = V1[:,i]/L #11316*30
'''
return V1
'''77*800 77*200 77*1转换为77*77的'''
def getUX(train_data2,U2,mean2,N,C):
'''类间协方差 77*200 '''
Wu=np.zeros((train_data2.shape[0],train_data2.shape[0]))
for i in range(C):
temp=U2[:,i]-mean2#77*200 77*1
temp2=temp*temp.T
Wu=Wu+temp2
'''类内协方差 Bu'''
tempX=np.zeros((train_data2.shape[0],N*C))#X-U之协方差 (77, 800)
U3=U2.A
for i in range(0,C):#200因为tile不对
tempX[:,i*4]=U3[:,i]
tempX[:,i*4+1]=U3[:,i]
tempX[:,i*4+2]=U3[:,i]
tempX[:,i*4+3]=U3[:,i]
'''77*800-77*77'''
Bu=np.zeros((train_data2.shape[0],train_data2.shape[0]))
for i in range(0,N*C):
temp=np.mat(train_data2[:,i]-tempX[:,i])#每幅图像相对于本类的平均差
temp2=temp*temp.T
Bu=Bu+temp2
'''
for i in range(train_data2.shape[0]): #特征向量归一化
L = np.linalg.norm(Bu[:,i])#默认是平方之后和求根 2范数 也就是模
Bu[:,i] = Bu[:,i]/L #11316*30
'''
V2=Bu.I*Wu
return V2
'''matrix 77*600'''
def TestLDA(train_data2,train_lable, test_data3, test_lable):
suc=0
for j in range(len(test_lable)):
testFacePca=test_data3[:,j]
tempFacePca=np.tile(testFacePca,(1,len(train_lable)))
diffPca=tempFacePca-train_data2
sqPca=diffPca.A**2#mat转A
sqDis=sqPca.sum(axis=0)
sortDisIndix=sqDis.argsort()
indexMin=sortDisIndix[0]#最小距离
if train_lable[indexMin]==test_lable[j]:
suc+=1
print("正确率%.3f"%(suc/len(test_lable)))
#loadFre 人脸库,我的是200人,每人取4张训练图片
if __name__ == '__main__':
'''80*80 *800 4--3 '''
train_data, train_lable, test_data, test_lable=loadFre()#
train_data=train_data.T
N=4 #每人4张
C=200#一共200人
mean=np.mean(train_data, axis=1)#6400 平均值
U=np.zeros((train_data.shape[0],C))#6400*200 每一类的均值
tempX=np.zeros((train_data.shape[0],N*C))#X-U之协方差
for i in range(0,C):#200因为tile不对
temp=train_data[:,i*N:(i+1)*N]#0-1-2-3
U[:,i]=np.mean(temp,axis=1)
tempX[:,i*4]=U[:,i]
tempX[:,i*4+1]=U[:,i]
tempX[:,i*4+2]=U[:,i]
tempX[:,i*4+3]=U[:,i]
train_dataMean=train_data-tempX
V1=getPCALie(np.mat(train_dataMean.T),0.9)#(6400, 77)
'''
Cx=np.zeros((N*C,N*C)) #(800, 800)
for i in range(0,tempX.shape[0]):
temp=np.mat(train_data[i,:]-tempX[i,:])#每幅图像相对于本类的平均差
Cx=Cx+temp.T*temp
V1=getPCALieK(Cx,0.9)#(800, 3)
'''
U2=V1.T*np.mat(U)#77*200
mean2=(np.mat(mean)*V1).T#77*1
train_data2=V1.T*np.mat(train_data)#77*800
'''数据量都很大'''
V2=getUX(train_data2,U2,mean2,N,C)#77*77 这个是lDA
V3=getLDALie(V2,50)#(77*20)
V4=V3.T*V1.T#(20,6400)
train_data3=V3.T*train_data2 #(77, 800) 20*800
'''测试部分,下面我只是测试集合减去6400*1的平均'''
'''
mean3=np.tile(mean,(len(test_lable),1))
test_data2=test_data-mean3
test_date4=V4*np.mat(test_data2.T)
'''
test_data3=V4*np.mat(test_data.T)#77*600
'''20 0.602 有没有去均值都是一样的
30 0.638 50 0.650'''
TestLDA(train_data3,train_lable, test_data3, test_lable)