人工神经网络训练样本的选择方法:
1.随机遍历法生成样本点
假设有12个样本,其中训练样本9个,测试样本3个。
%假设样本包含3个输入变量,1个输出变量,并用zeros进行初始化
in=zeros(12,3);
out=zeros(12,1);
%产生随机数,并用sort函数排序,生成随机序列n
k=rand(1,12);
[m,n]=sort(k);
%提取9个训练样本,3个测试样本
in_train=in(n(1:9),:);
out_train=out(n(1:9,:));
in_test=in(n(10:12),:);
out_test=out(n(10:12,:));
2.用randsample函数
用法:从1~n中随机返回不相同的k个数,a=randsample(n,k)
%提取9个训练样本,3个测试样本
a=randsample(12,12);
in_train=in(n(1:9),:);
out_train=out(n(1:9,:));
in_test=in(n(10:12),:);
out_test=out(n(10:12,:));
3.正交设计法
正交设计是最常用而且有长久历史的实验设计,是一种多因素实验设计和实验结果分析相结合的科学实验方法。用它进行实验时,是用已印好的表格———正交表科学地安排实验,使得实验尽可能地减少。
正交表是安排实验、分析实验的一种简单而容易掌握的有力工具。它是根据数理统计原理归纳出来的一种合理安排实验的表格,用Ln(mk)表示:表中L是代表“正交”之义;n表示横行数即实验次数;m表示每纵列中的不同字码的个数,即每个因素的水平数;k表示纵列数,即该均匀设计表最多安排的因素数。