关于fitcsvm函数的使用, 我在另一篇文章中有介绍. 在使用fitcsvm函数训练出来分类器之后, 为了直观感受分类器的效果, 一般需要画图表达. 结果, 我发现fitcsvm没有自带的画图参数. 然后, 我就啃文档里第一个有画分界线的例子. 最后画出了分界线.
官网例子
load fisheriris
X = meas(:,1:2);
y = ones(size(X,1),1);
rng(1);
SVMModel = fitcsvm(X,y,'KernelScale','auto','Standardize',true,'OutlierFraction',0.05);
svInd = SVMModel.IsSupportVector;
h = 0.02; % Mesh grid step size
[X1,X2] = meshgrid(min(X(:,1)):h:max(X(:,1)),...
min(X(:,2)):h:max(X(:,2)));
[~,score] = predict(SVMModel,[X1(:),X2(:)]);
scoreGrid = reshape(score,size(X1,1),size(X2,2));
figure
plot(X(:,1),X(:,2),'k.')
hold on
plot(X(svInd,1),X(svInd,2),'ro','MarkerSize',10)
contour(X1,X2,scoreGrid);
colorbar;
title('{\bf Iris Outlier Detection via One-Class SVM}')
xlabel('Sepal Length (cm)')
ylabel('Sepal Width (cm)')
legend('Observation','Support Vector')
hold off
这里, 主要讨论分界线的绘制, 因为得到分类器之后, 我们无法得到它的分界线方程. 通过观察, 例子中与画分界线的代码有关的部分如下:
h = 0.02; % Mesh grid step size
[X1,X2] = meshgrid(min(X(:,1)):h:max(X(:,1)),...
min(X(:,2)):h:max(X(:,2)));
[~,score] = predict(SVMModel,[X1(:),X2(:)]);
scoreGrid = reshape(score,size(X1,1),size(X2,2));
figure
hold on
contour(X1,X2,scoreGrid);
hold off
其中, 涉及到的陌生函数有meshgrid, predict, reshape, contour
简单介绍一下:
h = 0.02; % 设置取点的间隔
[X1,X2] = meshgrid(min(X(:,1)):h:max(X(:,1)),...
min(X(:,2)):h:max(X(:,2)));% 得到所有取点的矩阵
[~,score] = predict(SVMModel,[X1(:),X2(:)]);
% 应用得到的分类器对网格矩阵中的所有点进行分类, 只要取点间隔够小, 相当于对整个平面上的所有点进行分类结果的计算.
scoreGrid = reshape(score,size(X1,1),size(X2,2));
% 由于分类得到的score的对应顺序对不上网格, 所以需要用reshape对score进行改变行数列数
figure
hold on
contour(X1,X2,scoreGrid);
% 画出线,这里不是分界线, 只是等高线
hold off
理解原理之后, 以一个简单的男女分类问题为例:
SVMModel_rbf = fitcsvm(source_train,label_train,'BoxConstraint',10,'KernelFunction','rbf','KernelScale',2^0.5*2);
[X1,X2] = meshgrid(140:0.05:200,30:0.05:130);
% 140是训练集横轴最小值, 200是训练集横轴最大值,
% 30是训练集纵轴最小值, 130是训练集纵轴最大值,
[~,score] = predict(SVMModel_rbf,[X1(:),X2(:)]);
% 对网格进行分类结果的计算. 在计算前, 要先将X1, X2变形为列向量, 因为训练分类器时, 训练集为n*2的矩阵
% 所以, 也要把X1, X2 网格矩阵变形为n*2的矩阵.
scoreGrid = reshape(score(:,2),size(X1,1),size(X2,2));
% 改变score的行数和列数, 使之和网格[X1,X2]中的点一一对应.
% 由于输出的score也是n*2的矩阵,
% 第一列是对应正类的可能性, 第二类是对应负类的可能性, 两者互为相反数, 这里只取第二列,
% 也就是score(:,2)是一个n*1的列向量, 与变形后的X1, X2 网格矩阵一一对应,
% 这一步又将score(:,2)变形回来, 与变形前的X1, X2 网格矩阵一一对应.
contour(X1,X2,scoreGrid,[0 0]);
% 绘制等高线, 最后一个参数[0 0] 就是只绘制出score值为0的点的等高线, 也就是分界线.
legend('Female','Male','Support Vector','分界线');
hold off;