机器学习方面的降维讲解(PCA原理,奇异值分解):http://blog.csdn.net/abcjennifer/article/details/8002329
在图形识别方面,主成分分析(Principal Comonents Analysis,PCA)算是比较快速而且又准确的方式之一,它可以对抗图形平移旋转的事件发生,并且藉由主要特征(主成分)投影过后的数据做数据的比对,在多个特征信息里面,取最主要的K个,做为它的特征依据,在这边拿前面共变量矩阵的数据来做沿用,主成分分析使用的方法为计算共变量矩阵,在加上计算共变量矩阵的特征值及特征向量,将特征值以及所对应的特征向量排序之后,取前面主要K个特征向量当做主要特征,而OpenCV也可以对高维度的向量进行主成分分析的计算
数据原始的分布情况,红点代表着它的平均数
将坐标系位移,以红点为主要的原点
计算共变量矩阵以及共变量的特征值以及特征向量,将特征向量排序后投影回原始数据的结果的结果,也就是说,对照上面的图片,EigenVector的作用是找到主轴后,将原本的坐标系做旋转了
再来就是对它做投影,也就是降低维度的动作,将Y轴的数据全部归零,投影在X轴上
投影完之后,在将它转回原本的坐标系
PCA主成分分析,与线性回归有异曲同工之妙,也就是说,这条投影过后的直线,可以称做回归线,当它在做主轴旋转的时候,所投影的结果为最小均方误,在将它转置回来的时候,就形成了一条回归直线了
OpenCV的PCA输入必须要是单信道32位浮点数格式或是单信道64位浮点数格式的,参数为CV_32FC1或是CV_64FC1,程序写法如下
PCA程序实作
#include <cv.h> #include <highgui.h> #include <stdio.h> #include <stdlib.h> float Coordinates[20]={1.5,2.3, 3.0,1.7, 1.2,2.9, 2.1,2.2, 3.1,3.1, 1.3,2.7, 2.0,1.7, 1.0,2.0, 0.5,0.6, 1.0,0.9}; void PrintMatrix(CvMat *Matrix,int Rows,int Cols); int main() { CvMat *Vector1; CvMat *AvgVector; CvMat *EigenValue_Row; CvMat *EigenVector; Vector1=cvCreateMat(10,2,CV_32FC1); cvSetData(Vector1,Coordinates,Vector1->step); AvgVector=cvCreateMat(1,2,CV_32FC1); EigenValue_Row=cvCreateMat(2,1,CV_32FC1); EigenVector=cvCreateMat(2,2,CV_32FC1); cvCalcPCA(Vector1,AvgVector,EigenValue_Row,EigenVector,CV_PCA_DATA_AS_ROW); printf("Original Data:\n"); PrintMatrix(Vector1,10,2); printf("==========\n"); PrintMatrix(AvgVector,1,2); printf("\nEigne Value:\n"); PrintMatrix(EigenValue_Row,2,1); printf("\nEigne Vector:\n"); PrintMatrix(EigenVector,2,2); system("pause"); } void PrintMatrix(CvMat *Matrix,int Rows,int Cols) { for(int i=0;i<Rows;i++) { for(int j=0;j<Cols;j++) { printf("%.2f ",cvGet2D(Matrix,i,j).val[0]); } printf("\n"); } }执行结果:
#include <cv.h> #include <highgui.h> #include <stdio.h> #include <stdlib.h> float Coordinates[20]={1.5,2.3, 3.0,1.7, 1.2,2.9, 2.1,2.2, 3.1,3.1, 1.3,2.7, 2.0,1.7, 1.0,2.0, 0.5,0.6, 1.0,0.9}; void PrintMatrix(CvMat *Matrix,int Rows,int Cols); int main() { CvMat *Vector1; CvMat *AvgVector; CvMat *EigenValue_Row; CvMat *EigenVector; Vector1=cvCreateMat(10,2,CV_32FC1); cvSetData(Vector1,Coordinates,Vector1->step); AvgVector=cvCreateMat(1,2,CV_32FC1); EigenValue_Row=cvCreateMat(2,1,CV_32FC1); EigenVector=cvCreateMat(2,2,CV_32FC1); cvCalcPCA(Vector1,AvgVector,EigenValue_Row,EigenVector,CV_PCA_DATA_AS_ROW); cvProjectPCA(Vector1,AvgVector,EigenVector,Vector1); printf("Project Original Data:\n"); PrintMatrix(Vector1,10,2); system("pause"); } void PrintMatrix(CvMat *Matrix,int Rows,int Cols) { for(int i=0;i<Rows;i++) { for(int j=0;j<Cols;j++) { printf("%.2f ",cvGet2D(Matrix,i,j).val[0]); } printf("\n"); } }执行结果 :
#include <cv.h> #include <highgui.h> #include <stdio.h> #include <stdlib.h> float Coordinates[20]={1.5,2.3, 3.0,1.7, 1.2,2.9, 2.1,2.2, 3.1,3.1, 1.3,2.7, 2.0,1.7, 1.0,2.0, 0.5,0.6, 1.0,0.9}; int main() { CvMat *Vector1; CvMat *AvgVector; IplImage *Image1=cvCreateImage(cvSize(450,450),IPL_DEPTH_8U,3); Image1->origin=1; Vector1=cvCreateMat(10,2,CV_32FC1); cvSetData(Vector1,Coordinates,Vector1->step); AvgVector=cvCreateMat(1,2,CV_32FC1); CvMat *EigenValue_Row=cvCreateMat(2,1,CV_32FC1); CvMat *EigenVector=cvCreateMat(2,2,CV_32FC1); cvCalcPCA(Vector1,AvgVector,EigenValue_Row,EigenVector,CV_PCA_DATA_AS_ROW); cvProjectPCA(Vector1,AvgVector,EigenVector,Vector1); cvBackProjectPCA(Vector1,AvgVector,EigenVector,Vector1); printf("Back Project Original Data:\n"); for(int i=0;i<10;i++) { printf("%.2f ",cvGetReal2D(Vector1,i,0)); printf("%.2f ",cvGetReal2D(Vector1,i,1)); cvCircle(Image1,cvPoint((int)(cvGetReal2D(Vector1,i,0)*100),(int)(cvGetReal2D(Vector1,i,1)*100)),0,CV_RGB(0,0,255),10,CV_AA,0); printf("\n"); } cvCircle(Image1,cvPoint((int)((cvGetReal2D(AvgVector,0,0))*100),(int)((cvGetReal2D(AvgVector,0,1))*100)),0,CV_RGB(255,0,0),10,CV_AA,0); printf("==========\n"); printf("%.2f ",cvGetReal2D(AvgVector,0,0)); printf("%.2f ",cvGetReal2D(AvgVector,0,1)); cvNamedWindow("Coordinates",1); cvShowImage("Coordinates",Image1); cvWaitKey(0); }执行结果 :
另附:http://blog.csdn.net/yang_xian521/article/details/7445536