R称为复相关系数,R越大,y与x1,x2,x3.....的关系越密切,通常R大于0.8(或0.9)才认为相关关系成立
一个例子
matlab代码为
clc,clear
x1=[0.1:0.01:0.18]';
y=[42 41.5 45 45.5 45 47.5 49 55 50]';
x=[ones(9,1),x1];
%x(8,:)=[]; 去除异常点
%y(8,:)=[]; 去除异常点
[b,bint,r,rint,stats]=regress(y,x);
b,bint,stats,rcoplot(r,rint) %rcoplot是用来画残差图的,以便发现异常点
注意用这种方式的话,x的第一列一定要有一列1,相当于从第二列开始才是每个x的数据
matlab中还提供了rstool做回归分析(注意这种方式提供的x不需要在第一列多加一列1)
该界面可以向matlab工作区中导出几个数值,包括beta(回归系数),rmse(剩余标准差),residuals(残差),另外1还可以在该界面改变模型
非线性回归
用到nlinfit , nlparci , nlpredci 这些函数(这里提供的x不需要在第一列多加一列1)
nlinfit用来计算回归系数,nlparci用来计算回归系数的置信区间,nlpredci用来计算预测值的置信区间
[beta,r,j]=nlinfit(x,y,modelfun,beta0) 其中modelfun是提供模型的非线性函数的m文件,r,j这两个参数在后两个函数会用到
一个例子
matlab代码为
clear,clc
data=[8.55 470 300 10
3.79 285 80 10
4.82 470 300 120
0.02 470 80 120
2.75 470 80 10
14.39 100 190 10
2.54 100 80 65
4.35 470 190 65
13.00 100 300 54
8.50 100 300 120
0.05 100 80 120
11.32 285 300 10
3.13 285 190 120];
y=data(:,1);
x=data(:,2:4);
beta=[0.1 0.05 0.02 1 2]; %回归系数初值,任意取的
[betahat,r,j]=nlinfit(x,y,@huaxue,beta); %计算回归系数
betaci=nlparci(betahat,r,'jacobian',j); %计算回归系数的置信区间
betaa=[betahat',betaci]
[yhat,delta]=nlpredci(@huaxue,x,betahat,r,'jacobian',j) %计算预测值及其置信区间
其中huaxue文件的代码为
function yhat=huaxue(beta,x);
yhat=(beta(4)*x(:,2)-x(:,3)/beta(5))./(1+beta(1)*x(:,1)+beta(2)*x(:,2)+beta(3)*x(:,3));
当然也可以使用nlintool,更加方便,使用方式为
nlintool(x,y,'huaxue',beta)
可以得到一个交互式界面,并且可以导出各种参数值和置信区间
逐步回归
使用stepwise,会得到一个交互式界面,调用格式为
stepwise(x,y,inmodel,alpha)
inmodel为矩阵x的列数的指标,给出初始模型中包括的子集(可缺省),alpha为显著性水平(可缺省)