特征提取和特征选择

一、特征提取和特征选择异同
1.特征提取 :通过映射(变换)的方法,将高维的特征向量变换为低维特征向量。
2.特征选择:从原始特征中挑选出一些最具代表性、分类性能好的特征以达到降低特征空间维数的方法

二、基于距离可分性判据的特征提取方法
1.假设有n个原始特征:

希望通过线性映射压缩为d个特征Y=

其变换关系为,W为n*d矩阵。令为原空间的离散度矩阵,为映射后(也就是Y)离散度矩阵:

经过变换后的变为:

对上式的W的各个分量求偏导数并令其为零,即可以确定一个W的值。

三、(选做)

四、
(1)主对角线上代表各个维度内数据的方差,而非主对角线上的元素代表维度之间数据的协方差。(所以一定是一个实对称矩阵)
(2)最佳准则就是尽可能少地减少降维之后的信息损失
(3)因为在矩阵相似对角化以后,矩阵变成了只有主对角线上有元素。也就是说协方差矩阵的维度之间的方差全部变成了0,各维度分量也就没有了相关性
五、
(1)d=2:
整合矩阵->PCA分析:

%MATLAB 代码
X =[0,0,0;
    1,0,0;
    1,0,1;
    1,1,0;
    0,0,1;
    0,1,0;
    0,1,1;
    1,1,1]%将两类样本整合在一起,每一行代表一个样例
[m,n]=size(X); %计算矩阵的行m和列n
mv=mean(X); %计算各变量的均值
st=std(X); %计算各变量的标准差
X=(X-repmat(mv,m,1))./repmat(st,m,1); %标准化矩阵X
R1=cov(X); %协方差矩阵
[V,D]=eig(R); %计算矩阵R的特征向量矩阵V和特征值矩阵D,特征值由小到大
min = realmax %最大浮点数
r = -1
for k = 1:n
  if(D(k,k) < min)
    min = D(k,k)
    r = k %找到最小方差所在的维度
V(:,(r:r)) = [] %将特征值对应的特征向量删除
S = X*V %将原样本集多余维度删除

%结果记录:
S =

(2)基本等同上方程序

结果记录:
S=

六、(灰度矩阵)

%MATLAB代码

I = [ 
    2,1,2,0,1; 
    0,2,1,1,2; 
    0,1,2,2,0;
    1,2,2,0,1;
    2,0,1,0,1
    ];

[glcm1, SI1] = graycomatrix(I, 'offset', [0 1],'NumLevels', 3, 'G', [])%角度为0

[glcm2, SI2] = graycomatrix(I, 'offset', [-1 1],'NumLevels', 3, 'G', [])%角度为45

[glcm3, SI3] = graycomatrix(I, 'offset', [-1 0],'NumLevels', 3, 'G', [])%角度为90

[glcm4, SI4] = graycomatrix(I, 'offset', [-1 -1],'NumLevels', 3, 'G', [])%角度为135


%结果为:


你可能感兴趣的:(特征提取和特征选择)