数学建模 偏最小二乘回归模型

偏最小二乘回归

背景:在实际问题中,经常遇到需要研究两组多重相关变量间的相互依赖关系,并研究用一组变量(常称为自变量或预测变量)去预测另一组变量(常称为因变量或响应变量),除了最小二乘准则下的经典多元线性回归分析(MLR),提取自变量组主成分的主成分回归分析(PCR)等方法外,还有近年发展起来的偏最小二乘(PLS)回归方法。

偏最小二乘回归提供一种多对多线性回归建模的方法,特别当两组变量的个数很多,且都存在多重相关性,而观测数据的数量(样本量)又较少时,用偏最小二乘回归建立的模型具有传统的经典回归分析等方法所没有的优点。

偏最小二乘回归分析在建模过程中集中了主成分分析,典型相关分析和线性回归分析方法的特点,因此在分析结果中,除了可以提供一个更为合理的回归模型外,还可以同时完成一些类似于主成分分析和典型相关分析的研究内容,提供更丰富、深入的一些信息。

matlab如下:(模板)

代码有详解

clc,clear 
load pz.txt %原始数据存放在纯文本文件 pz.txt 中
mu=mean(pz);sig=std(pz); %求均值和标准差
rr=corrcoef(pz); %求相关系数矩阵
data=zscore(pz); %数据标准化
n=3;m=3; %n 是自变量的个数,m 是因变量的个数
x0=pz(:,1:n);y0=pz(:,n+1:end); 
e0=data(:,1:n);f0=data(:,n+1:end); 
num=size(e0,1);%求样本点的个数
chg=eye(n); %w 到 w*变换矩阵的初始化
for i=1:n 
%以下计算 w,w*和 t 的得分向量,
 matrix=e0'*f0*f0'*e0; 
 [vec,val]=eig(matrix); %求特征值和特征向量
 val=diag(val); %提出对角线元素
 [val,ind]=sort(val,'descend'); 
 w(:,i)=vec(:,ind(1)); %提出最大特征值对应的特征向量
 -538-
 w_star(:,i)=chg*w(:,i); %计算 w*的取值
 t(:,i)=e0*w(:,i); %计算成分 ti 的得分
 alpha=e0'*t(:,i)/(t(:,i)'*t(:,i)); %计算 alpha_i 
 chg=chg*(eye(n)-w(:,i)*alpha'); %计算 w 到 w*的变换矩阵
 e=e0-t(:,i)*alpha'; %计算残差矩阵
 e0=e; 
%以下计算 ss(i)的值
 beta=[t(:,1:i),ones(num,1)]\f0; %求回归方程的系数
 beta(end,:)=[]; %删除回归分析的常数项
 cancha=f0-t(:,1:i)*beta; %求残差矩阵
 ss(i)=sum(sum(cancha.^2)); %求误差平方和
%以下计算 press(i) 
 for j=1:num 
 t1=t(:,1:i);f1=f0; 
 she_t=t1(j,:);she_f=f1(j,:); %把舍去的第 j 个样本点保存起来
 t1(j,:)=[];f1(j,:)=[]; %删除第 j 个观测值
 beta1=[t1,ones(num-1,1)]\f1; %求回归分析的系数
 beta1(end,:)=[]; %删除回归分析的常数项
 cancha=she_f-she_t*beta1; %求残差向量
 press_i(j)=sum(cancha.^2); 
 end 
 press(i)=sum(press_i); 
 if i>1 
 Q_h2(i)=1-press(i)/ss(i-1); 
 else 
 Q_h2(1)=1; 
 end 
 if Q_h2(i)<0.0975 
 fprintf('提出的成分个数 r=%d',i); 
 r=i; 
 break 
 end 
end 
beta_z=[t(:,1:r),ones(num,1)]\f0; %求 Y 关于 t 的回归系数
beta_z(end,:)=[]; %删除常数项
xishu=w_star(:,1:r)*beta_z; %求Y关于X的回归系数,且是针对标准数据的回归系数,
每一列是一个回归方程
mu_x=mu(1:n);mu_y=mu(n+1:end); 
sig_x=sig(1:n);sig_y=sig(n+1:end); 
-539-
for i=1:m 
 ch0(i)=mu_y(i)-mu_x./sig_x*sig_y(i)*xishu(:,i); %计算原始数据的回归方程的常数
项
end 
for i=1:m 
 xish(:,i)=xishu(:,i)./sig_x'*sig_y(i); %计算原始数据的回归方程的系数,每一列是一
个回归方程
end 
sol=[ch0;xish] %显示回归方程的系数,每一列是一个方程,每一列的第一个数是
常数项
save mydata x0 y0 num xishu ch0 xish

画直方图的 MATLAB 程序为:bar(xishu’)

画体能训练的预测图的 MATLAB 程序如下:

如果你要参加数学建模竞赛的话,你会发现很多题都会运用画体能训练的预测图,并将它直观的表示出来,你的目的就达到了。

load mydata 
num 
ch0=repmat(ch0,num,1); 
yhat=ch0+x0*xish; %计算 y 的预测值
y1max=max(yhat); 
y2max=max(y0); 
 -542-
ymax=max([y1max;y2max]) 
cancha=yhat-y0; %计算残差
subplot(2,2,1) 
plot(0:ymax(1),0:ymax(1),yhat(:,1),y0(:,1),'*') 
subplot(2,2,2) 
plot(0:ymax(2),0:ymax(2),yhat(:,2),y0(:,2),'O') 
subplot(2,2,3) 
plot(0:ymax(3),0:ymax(3),yhat(:,3),y0(:,3),'H')

你可能感兴趣的:(数学模型介绍,回归,matlab,算法)