在建模时,如果数据较少,我们常用交叉验证的方法来验证模型的正确性。
在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。这个过程一直进行,直到所有的样本都被预报了一次而且仅被预报一次。把每个样本的预报误差平方加和,称为PRESS(predicted Error Sum of Squares)。
常见的交叉验证形式
<span style="font-size:14px;">%% 交叉验证 %申明空间来存储最优的量 desired_spread=[]; mse_max=10e20; desired_input=[]; desired_output=[]; result_perfp=[]; %生成一个数据的分组 indices = crossvalind('Kfold',length(p_train),4); %进度条 h=waitbar(0,'正在寻找最优化参数....'); k=1; for i = 1:4 perfp=[]; disp(['以下为第',num2str(i),'次交叉验证结果']) %分类器 test = (indices == i); train = ~test; p_cv_train=p_train(train,:); t_cv_train=t_train(train,:); p_cv_test=p_train(test,:); t_cv_test=t_train(test,:); p_cv_train=p_cv_train'; t_cv_train=t_cv_train'; p_cv_test= p_cv_test'; t_cv_test= t_cv_test'; %归一化 [p_cv_train,minp,maxp,t_cv_train,mint,maxt]=premnmx(p_cv_train,t_cv_train); p_cv_test=tramnmx(p_cv_test,minp,maxp); %循环测试每个spread值 for spread=0.1:0.1:2; net=newgrnn(p_cv_train,t_cv_train,spread); waitbar(k/80,h); disp(['当前spread值为', num2str(spread)]); test_Out=sim(net,p_cv_test); test_Out=postmnmx(test_Out,mint,maxt); error=t_cv_test-test_Out; disp(['当前网络的mse为',num2str(mse(error))]) perfp=[perfp mse(error)]; %记录误差最小值并记录输入输出 if mse(error)<mse_max mse_max=mse(error); desired_spread=spread; desired_input=p_cv_train; desired_output=t_cv_train; end k=k+1; end result_perfp(i,:)=perfp; end; close(h) %得到最佳spread disp(['最佳spread值为',num2str(desired_spread)]) disp(['此时最佳输入值为']) desired_input disp(['此时最佳输出值为']) desired_output</span>