主成分分析(MATLAB)

 本文借鉴了数学建模清风老师的课件与思路,可以点击查看链接查看清风老师视频讲解:清风数学建模:https://www.bilibili.com/video/BV1DW411s7wi

 一、前言

主成分分析(MATLAB)_第1张图片

 主成分分析(MATLAB)_第2张图片

主成分分析(MATLAB)_第3张图片

 二、主成分分析思想

主成分分析(MATLAB)_第4张图片

 主成分分析(MATLAB)_第5张图片

三、 主成分分析计算步骤

计算步骤可放入论文中。

step1:对数据x标准化为X

主成分分析(MATLAB)_第6张图片

 step2:计算样本协方差矩阵(相关系数矩阵)

主成分分析(MATLAB)_第7张图片

相关系数矩阵可美化后放入论文中,详见视频17:40 。

注:第一步和第二步在MATLAB中可直接一步到位。 

  step3:计算R的特征值和特征向量

主成分分析(MATLAB)_第8张图片

   step4:计算主成分贡献率和累计贡献率

主成分分析(MATLAB)_第9张图片

    step5:写出主成分,取累计贡献率超过80%的特征值所对应的主成分

主成分分析(MATLAB)_第10张图片

     step6: 根据系数分析主成分代表的意义

      step7:  利用主成分的结果进行后续的分析

主成分分析(MATLAB)_第11张图片

 不能用于评价模型原因:降维是将有数据的指标进行减少,既然有数据何不用Topsis?

主成分分析(MATLAB)_第12张图片

四、例题讲解

主成分分析(MATLAB)_第13张图片

 此题直接进行到了第二步,实际中不会这样。

主成分分析(MATLAB)_第14张图片

主成分分析(MATLAB)_第15张图片

 主成分分析(MATLAB)_第16张图片

 五、主成分分析程序(MATLAB)

该数据为聚类数据

clear;clc
 load data1.mat   % 主成分聚类
%  load data2.mat   % 主成分回归

% 注意,这里可以对数据先进行描述性统计
% 描述性统计的内容见第5讲.相关系数
[n,p] = size(x);  % n是样本个数,p是指标个数

%% 第一步:对数据x标准化为X
X=zscore(x);   % matlab内置的标准化函数(x-mean(x))/std(x)

%% 第二步:计算样本协方差矩阵
R = cov(X);

%% 注意:以上两步可合并为下面一步:直接计算样本相关系数矩阵
R = corrcoef(x);
disp('样本相关系数矩阵为:')
disp(R)

%% 第三步:计算R的特征值和特征向量
% 注意:R是半正定矩阵,所以其特征值不为负数
% R同时是对称矩阵,Matlab计算对称矩阵时,会将特征值按照从小到大排列哦
% eig函数的详解见第一讲层次分析法的视频
[V,D] = eig(R);  % V 特征向量矩阵  D 特征值构成的对角矩阵


%% 第四步:计算主成分贡献率和累计贡献率
lambda = diag(D);  % diag函数用于得到一个矩阵的主对角线元素值(返回的是列向量)
lambda = lambda(end:-1:1);  % 因为lambda向量是从小大到排序的,我们将其调个头
contribution_rate = lambda / sum(lambda);  % 计算贡献率
cum_contribution_rate = cumsum(lambda)/ sum(lambda);   % 计算累计贡献率  cumsum是求累加值的函数
disp('特征值为:')
disp(lambda')  % 转置为行向量,方便展示
disp('贡献率为:')
disp(contribution_rate')
disp('累计贡献率为:')
disp(cum_contribution_rate')
disp('与特征值对应的特征向量矩阵为:')
% 注意:这里的特征向量要和特征值一一对应,之前特征值相当于颠倒过来了,因此特征向量的各列需要颠倒过来
%  rot90函数可以使一个矩阵逆时针旋转90度,然后再转置,就可以实现将矩阵的列颠倒的效果
V=rot90(V)';
disp(V)


%% 计算我们所需要的主成分的值
m =input('请输入需要保存的主成分的个数:  ');
F = zeros(n,m);  %初始化保存主成分的矩阵(每一列是一个主成分)
for i = 1:m
    ai = V(:,i)';   % 将第i个特征向量取出,并转置为行向量
    Ai = repmat(ai,n,1);   % 将这个行向量重复n次,构成一个n*p的矩阵
    F(:, i) = sum(Ai .* X, 2);  % 注意,对标准化的数据求了权重后要计算每一行的和
end

主成分分析(MATLAB)_第17张图片

代码结果分析:

主成分分析(MATLAB)_第18张图片

 六、主成分分析用于聚类(SPSS)

这里的聚类和下面的回归可以详看视频。

主成分分析(MATLAB)_第19张图片

主成分分析(MATLAB)_第20张图片

 这里的聚类是用的层次聚类

主成分分析(MATLAB)_第21张图片

七、主成分分析用于回归(Stata)

主成分分析(MATLAB)_第22张图片

 主成分分析(MATLAB)_第23张图片

 八、其他

主成分分析(MATLAB)_第24张图片

你可能感兴趣的:(数学建模,matlab)