数据压缩算法PCA使用指南

来源:投稿 作者:小灰灰
编辑:学姐

PCA主成分分析算法

PCA的使用范围

PCA(principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据压缩算法。

在PCA中,数据从原来的坐标系转换到新的坐标系,由数据本身决定。

使用的用途很广,在人脸识别中(EigenFace,deepid),三维人脸重建中的(3DMM模型),想用数据降维时,通过PCA降维可以发现更便于人类理解的特征;同时也可以用于去燥等等。

问题

假设有一张图片是128*128 大小的图片,那我们就可以当成n=128*128, 也就是将矩阵拉成一维的,也就是X是一批数据组成的集合,那么PCA就是通过每一个点刻画这样一种分布,因为原本的X是复杂的。那么就需要找到一个主向量。

2.1 先计算协方差的特征值和特征向量

我们有40个人,每个人10张图片,也就是总共400张图片。图片大小为112*92。

数据压缩算法PCA使用指南_第1张图片

现在我们要对这400张图片进行求特征值与特征向量。

数据压缩算法PCA使用指南_第2张图片

img_list = []
for i in range(1,41):
    for j in range(1,11):
        file = "ORL/s%d/%d.bmp" % (i,j)
        img = cv2.imread(file,cv2.IMREAD_GRAYSCALE)
        img = img.astype(np.float32)/255.0
        img_list.append(img)
imgs = np.zeros([400,10304],dtype=np.float32)

这是从ORL中读取数据。

for i in range(0,400):
    imgs[i,:] = img_list[i].reshape(92*112)
plt.imshow(imgs)  # 显示图片
plt.show()
plt.savefig('lena_new_sz.png')

然后将这些数据保存到lena_new_sz.png文件中。

imgs = np.zeros([400,10304],dtype=np.float32)
for i in range(0,400):
    imgs[i,:] = img_list[i].reshape(-1)
# plt.imshow(imgs)  # 显示图片
# plt.show()
# plt.savefig('lena_new_sz.png')
imgs_mean = imgs.sum(axis=0)/400.0 #求平均值
np.savetxt('mean.txt',imgs_mean,fmt="%.5f")

imgs_mean就是平均脸

数据压缩算法PCA使用指南_第3张图片

我们将这个平均脸显示出来是:

数据压缩算法PCA使用指南_第4张图片

进行均值归一化。

imgs = imgs - imgs_mean
#conv = imgs.transpose(1,0).dot(imgs)计算协方差矩阵,就是conv
conv = imgs.dot(imgs.transpose(1,0))
print(conv.shape)#(10304, 10304)对协方差矩阵求特征值eig_value,特征向量eig_vector

eig_value,eig_vector = np.linalg.eig(conv)
print(eig_value.shape,eig_vector.shape)#(10304,) (10304, 10304)算完之后,转完32的浮点数,保存文本和二进数。
eig_value = eig_value.astype(np.float32)
eig_vector = eig_vector.astype(np.float32)
eig_vector = imgs.transpose(1,0).dot(eig_vector)
np.savetxt('eig_vetor400.txt',eig_vector,fmt="%.5f")
np.savetxt('eig_value400.txt',eig_value,fmt="%.5f")
eig_vector.tofile('eig_vector400.bin')

特征向量

数据压缩算法PCA使用指南_第5张图片

特征值

数据压缩算法PCA使用指南_第6张图片

2.2 重构出人脸

通过评价脸,特征值,和特征向量将图片显示出来

imgs_mean = np.loadtxt('mean.txt')
eig_vector = np.fromfile('eig_vector.bin',dtype = np.float32)
eig_vector = eig_vector.reshape(10304,-1)
u = eig_vector[:,:256]
for i in range(0,256):
    face = u[:,i] + imgs_mean
    face = face * 255
    face[face<0] = 0
    face[face>255]=255
    face = face.astype(np.uint8).reshape(112,-1)
    cv2.imwrite('eigface/%s.bmp'%i,face)

可得出,我们取出了前256个特征。显示出这些的特征脸。

数据压缩算法PCA使用指南_第7张图片

我们将上面的特征脸重构出人脸。

for i in range(1,41):
    for j in range(1,11):
        file = "ORL/s%d/%d.bmp" % (i,j)
        img = cv2.imread(file,cv2.IMREAD_GRAYSCALE)
        img = img.astype(np.float32)/255.0
        img = img.reshape(-1)
        img = img - imgs_mean
        prj = img.dot(u)
        np.savetxt('features/%s_%s.txt'%(i,j),prj,fmt="%.5f")
        cons = u.dot(prj)
        cons = cons + imgs_mean
        cons = cons*255
        cons[cons<0]=0
        cons[cons>255]=255
        cons = cons.astype(np.uint8).reshape(112,-1)
        cv2.imwrite('construct/%s_%s.bmp'%(i,j),cons)

重构出来的图片

数据压缩算法PCA使用指南_第8张图片

相对应于原始的人脸

数据压缩算法PCA使用指南_第9张图片

因为我们取了256个特征值,如果是400,那么将会更接近于原始图片。

机器学习干货+论文资料点击卡片关注获取

你可能感兴趣的:(粉丝的投稿,深度学习干货,python,计算机视觉,算法)