我们知道SVM的基本原理就是找一个超平面(广义平面)将样本分为几个部分,即分类。
MATLAB中自带SVM包,使用起来也十分方便,假如X是特征矩阵,Y是分类标签(可以是数值(1、2)也可以是string,总之有区别就行。)
SVMModel = fitcsvm(X,y) %训练分类器
CVSVMModel = crossval(SVMModel); %分类器的交叉验证
classLoss = kfoldLoss(CVSVMModel)% 样本内错误率
[~,score] = predict(SVMModel,X_test)%; %样本外的数据进行分类预测
[label,scorePred] = kfoldPredict(CVSVMModel); %样本外的数据进行分类预测结果,
我们在训练分类器的时候需要选择是线性分类还是非线性分类,比如如下两种:显然第一种适合线性分类,第二种适合曲线分类,也就是存在“异或”问题,需要映射到高维空间来寻找超平面。这种类似的选择称为“核函数”的选择,fitcsvm命令的KernelFunction可以选择三个核函数:‘linear’, ‘gaussian’ (or ‘rbf’), ‘polynomial’,当然也可以自己编写核函数。核函数的选择是SVM分类器的最重要的参数。
举例:
SVMModel = fitcsvm(X,indx,'ClassNames',[false true],'Standardize',true,...
'KernelFunction','rbf','BoxConstraint',1);
%MATLAB自带数据,每一个样本都是两个特征,Y代表其分类,此数据中分类标签为3种。
load fisheriris
X = meas(:,3:4);
Y = species;
%%将数据二维展示;%图中不同的颜色即为不同的标签。
figure
gscatter(X(:,1),X(:,2),Y);
h = gca;
lims = [h.XLim h.YLim]; % Extract the x and y axis limits
title('{\bf Scatter Diagram of Iris Measurements}');
xlabel('Petal Length (cm)');
ylabel('Petal Width (cm)');
legend('Location','Northwest');
%不同分类训练分类器
SVMModels = cell(3,1);
classes = unique(Y);
rng(1); % For reproducibility
for j = 1:numel(classes);
indx = strcmp(Y,classes(j)); % Create binary classes for each classifier
SVMModels{j} = fitcsvm(X,indx,'ClassNames',[false true],'Standardize',true,...
'KernelFunction','rbf','BoxConstraint',1);
end
%用meshgrid画出网格,并将网格点作为测试样本。计算每个测试样本的得分。
其中scores是一个多行三列的向量,每一列代表此种分类的可能性大小。maxScore代表最可能的分类。
d = 0.02;
[x1Grid,x2Grid] = meshgrid(min(X(:,1)):d:max(X(:,1)),...
min(X(:,2)):d:max(X(:,2)));
xGrid = [x1Grid(:),x2Grid(:)];
N = size(xGrid,1);
Scores = zeros(N,numel(classes));
for j = 1:numel(classes);
[~,score] = predict(SVMModels{j},xGrid);
Scores(:,j) = score(:,2); % Second column contains positive-class scores
end
[~,maxScore] = max(Scores,[],2);
%二维显示训练样本和测试样本。其中将不同的预测分类结果用不同的颜色展示
figure
h(1:3) = gscatter(xGrid(:,1),xGrid(:,2),maxScore,...
[0.1 0.5 0.5; 0.5 0.1 0.5; 0.5 0.5 0.1]);%预测分类结果用不同的颜色展示
hold on
h(4:6) = gscatter(X(:,1),X(:,2),Y);%画出原始的训练样本
title('{\bf Iris Classification Regions}');
xlabel('Petal Length (cm)');
ylabel('Petal Width (cm)');
legend(h,{'setosa region','versicolor region','virginica region',...
'observed setosa','observed versicolor','observed virginica'},...
'Location','Northwest');
axis tight
hold off
算法类文章我都会同期更新到个人公众号:宽客塔,欢迎关注~~
这个公众号以前是写金融类消息的,后来因为个人转行,就改为分享机器学习算法知识,也算是边学边写,跟大家共同学习~