Python PCA-LDA人脸识别

在看论文改进PCA_LDA的人脸识别算法研究_马帅旗和https://blog.csdn.net/xiaomage_gf/article/details/61631293

上写的LDA人脸识别算法,加载人脸库的函数没贴出来,其他的都有了。大概整理了两天时间写出的。

# -*- coding: utf-8 -*-
'''9/8/6 LDA的Freset人脸库
算法步骤,将图像转为列向量,计算全局平均图像,每一类的平均图像,
计算类间,类内的协方差矩阵,计算投影矩阵;分类器识别'''
import os
import numpy as np
import cv2
import sys
from lbp2D.pca import (loadFre)#库函数的
import math

def getLDALie(data,k):   
    D,V =np.linalg.eig(data) #特征值与特征向量 #200*200的
    DIndex=np.argsort(-D)#将D的索引从大到小排序
    VIndex=DIndex[0:k]#因为是列的,所以是前N个
    V1=V[:,VIndex]#(800, 77)      
    return V1
    
    
def getPCALie(Z,Threshold):
    '''平均脸''' 
    T1 = Z*Z.T #使用矩阵计算,所以前面mat
    D,V =np.linalg.eig(T1) #特征值与特征向量 #200*200的
    DIndex=np.argsort(-D)#将D的索引从大到小排序
    lenD=len(DIndex)
    k=0
    for j in range(lenD):
        temp_DInd_I=DIndex[:j]
        if(D[temp_DInd_I]/D.sum()).sum()>=Threshold:
            k=len(temp_DInd_I)
            break
    print(k)
    VIndex=DIndex[0:k]#因为是列的,所以是前N个
    V1=V[:,VIndex]#(800, 77)   
    V1 = Z.T*V1 #(6400, 77)
    '''
    for i in range(k): #特征向量归一化
        L = np.linalg.norm(V1[:,i])#默认是平方之后和求根 2范数 也就是模
        V1[:,i] = V1[:,i]/L  #11316*30
    '''
    return V1
'''77*800 77*200 77*1转换为77*77的'''
def getUX(train_data2,U2,mean2,N,C):
    
    '''类间协方差 77*200 '''   
    Wu=np.zeros((train_data2.shape[0],train_data2.shape[0]))
    for i in range(C):
        temp=U2[:,i]-mean2#77*200 77*1
        temp2=temp*temp.T
        Wu=Wu+temp2
    '''类内协方差 Bu'''                
    tempX=np.zeros((train_data2.shape[0],N*C))#X-U之协方差  (77, 800)
    U3=U2.A
    for i in range(0,C):#200因为tile不对
        tempX[:,i*4]=U3[:,i]
        tempX[:,i*4+1]=U3[:,i]
        tempX[:,i*4+2]=U3[:,i]
        tempX[:,i*4+3]=U3[:,i]       
    '''77*800-77*77'''
    Bu=np.zeros((train_data2.shape[0],train_data2.shape[0]))    
    for i in range(0,N*C):        
        temp=np.mat(train_data2[:,i]-tempX[:,i])#每幅图像相对于本类的平均差
        temp2=temp*temp.T
        Bu=Bu+temp2
    '''
    for i in range(train_data2.shape[0]): #特征向量归一化
        L = np.linalg.norm(Bu[:,i])#默认是平方之后和求根 2范数 也就是模
        Bu[:,i] = Bu[:,i]/L  #11316*30
    '''
    V2=Bu.I*Wu 
    return V2
'''matrix 77*600'''
def TestLDA(train_data2,train_lable, test_data3, test_lable):
    suc=0
    for j in range(len(test_lable)):
        testFacePca=test_data3[:,j]
        tempFacePca=np.tile(testFacePca,(1,len(train_lable)))
        diffPca=tempFacePca-train_data2
        sqPca=diffPca.A**2#mat转A 
        sqDis=sqPca.sum(axis=0)
        sortDisIndix=sqDis.argsort()
        indexMin=sortDisIndix[0]#最小距离
        if train_lable[indexMin]==test_lable[j]:
            suc+=1
    print("正确率%.3f"%(suc/len(test_lable)))
#loadFre    人脸库,我的是200人,每人取4张训练图片
if __name__ == '__main__':
    '''80*80 *800 4--3  '''
    train_data, train_lable, test_data, test_lable=loadFre()#
    train_data=train_data.T
    N=4 #每人4张
    C=200#一共200人
    mean=np.mean(train_data, axis=1)#6400  平均值
    U=np.zeros((train_data.shape[0],C))#6400*200 每一类的均值
    tempX=np.zeros((train_data.shape[0],N*C))#X-U之协方差    
    for i in range(0,C):#200因为tile不对
        temp=train_data[:,i*N:(i+1)*N]#0-1-2-3 
        U[:,i]=np.mean(temp,axis=1)
        tempX[:,i*4]=U[:,i]
        tempX[:,i*4+1]=U[:,i]
        tempX[:,i*4+2]=U[:,i]
        tempX[:,i*4+3]=U[:,i]
    train_dataMean=train_data-tempX
    V1=getPCALie(np.mat(train_dataMean.T),0.9)#(6400, 77)       
    '''        
    Cx=np.zeros((N*C,N*C)) #(800, 800)
    for i in range(0,tempX.shape[0]):        
        temp=np.mat(train_data[i,:]-tempX[i,:])#每幅图像相对于本类的平均差
        Cx=Cx+temp.T*temp
    V1=getPCALieK(Cx,0.9)#(800, 3)
    '''
    U2=V1.T*np.mat(U)#77*200
    mean2=(np.mat(mean)*V1).T#77*1
    train_data2=V1.T*np.mat(train_data)#77*800        
   
    '''数据量都很大'''
    V2=getUX(train_data2,U2,mean2,N,C)#77*77 这个是lDA
    V3=getLDALie(V2,50)#(77*20)
    V4=V3.T*V1.T#(20,6400)
    train_data3=V3.T*train_data2 #(77, 800) 20*800
    '''测试部分,下面我只是测试集合减去6400*1的平均'''
    '''
    mean3=np.tile(mean,(len(test_lable),1))   
    test_data2=test_data-mean3
    test_date4=V4*np.mat(test_data2.T)
    '''
    test_data3=V4*np.mat(test_data.T)#77*600
    '''20 0.602 有没有去均值都是一样的
    30 0.638 50 0.650'''
    TestLDA(train_data3,train_lable, test_data3, test_lable)
    
    

你可能感兴趣的:(人脸识别)