1.安装
(1)将下载下来的libsvm放在MATLAB安装的toolbox文件夹下。如下图所示:
(2)在MATLAB的地址栏中找到mex64文件所在的位置一般是放在Windows文件夹中,如下图所示:
(3)测试:将heart_scale文件放在Windows文件夹下;
命令窗口输入:[heart_scale_label, heart_scale_inst] = libsvmread('heart_scale'); %这里的 libsvmread()对应libsvmread.mex64文件
model = svmtrain(heart_scale_label, heart_scale_inst, '-c 1 -g 0.07');%这 里的svmtrain()对应svmtrain.mex64文件
[predict_label, accuracy, dec_values] = svmpredict(heart_scale_label,hea rt_scale_inst, model);% 这里的svmpredict()对应svmpredict.mex64文件
输出结果如下图所示,则表明Libsvm工具可以使用。
#iter为迭代次数,nu是你选择的核函数类型的参数,obj为SVM文件转换为的二次规划求解得到的最小值,rho为判决函数的偏置项b,nSV为标准支持向量个数
2.使用
(1) libSVM的数据格式
Label 1:value 2:value ….
Label:是类别的标识,比如上节train.model中提到的1 -1,你可以自己随意定,比如-10,0,15。当然,如果是回归,这是目标值,就要实事求是了。
Value:就是要训练的数据,从分类的角度来说就是特征值,数据之间用空格隔开
注:如果特征值为0,特征冒号前面的(姑且称做序号)可以不连续。如:
-15 1:0.708 3:-0.3333
(2)svmscale的用法
svmscale是用来对原始样本进行缩放的,范围可以自己定,一般是[0,1]或[-1,1]。缩放的目的主要是
1)防止某个特征过大或过小,从而在训练中起的作用不平衡;
2)为了计算速度。因为在核计算中,会用到内积运算或exp运算,不平衡的数据可能造成计算困难。
用法:svmscale [-l lower] [-u upper]
[-y y_lower y_upper]
[-s save_filename]
[-r restore_filename] filename
其中,[]中都是可选项:
-l:设定数据下限;lower:设定的数据下限值,缺省为-1
-u:设定数据上限;upper:设定的数据上限值,缺省为 1
-y:是否对目标值同时进行缩放;y_lower为下限值,y_upper为上限值;
-s save_filename:表示将缩放的规则保存为文件save_filename;
-r restore_filename:表示将按照已经存在的规则文件restore_filename进行缩放;
filename:待缩放的数据文件,文件格式按照libsvm格式。
e.g.默认情况下,只需要输入要缩放的文件名:(已经存在的文件为test.txt)
svmscale test.txt
这时,test.txt中的数据已经变成[-1,1]之间的数据了。但是,这样原来的数据就被覆盖了,
e.g.为了让规划好的数据另存为其他的文件,我们用一个dos的重定向符 > 来另存为(假设为out.txt):
svmscale test.txt > out.txt
运行后,out.txt文件就是规范后的数据。
e.g.我们想设定数据范围[0,1],并把规则保存为test.range文件:
svmscale –l 0 –u 1 –s test.range test.txt > out.txt
这时,目录下又多了一个test.range文件,可以用记事本打开,下次就可以用-r test.range来载入了。
(3) svmtrain的用法
svntrain对训练数据集的训练,并可以获得SVM模型。
用法: svmtrain [options training_set_file model_file]
其中,options为操作参数,可用的选项即表示的涵义如下所示:
-s 设置svm类型:
0 – C-SVC
1 – v-SVC
2 – one-class-SVM
3 – ε-SVR
4 – n - SVR
-t 设置核函数类型,默认值为2
0 -- 线性核:u'*v
1 -- 多项式核: (g*u'*v+ coef 0)degree
2 -- RBF 核:exp(-γ*||u-v||2)
3 -- sigmoid 核:tanh(γ*u'*v+ coef 0)
-d degree: 设置多项式核中degree的值,默认为3
-gγ: 设置核函数中γ的值,默认为1/k,k为特征(或者说是属性)数;
-r coef 0:设置核函数中的coef 0,默认值为0;
-c cost:设置C-SVC、ε-SVR、n - SVR中从惩罚系数C,默认值为1;
-n v :设置v-SVC、one-class-SVM 与n - SVR 中参数n ,默认值0.5;
-p ε :设置v-SVR的损失函数中的e ,默认值为0.1;
-m cachesize:设置cache内存大小,以MB为单位,默认值为40;
-e ε :设置终止准则中的可容忍偏差,默认值为0.001;
-h shrinking:是否使用启发式,可选值为0 或1,默认值为1;
-b 概率估计:是否计算SVC或SVR的概率估计,可选值0 或1,默认0;
-wi weight:对各类样本的惩罚系数C加权,默认值为1;
-v n:n折交叉验证模式;
model_file:可选项,为要保存的结果文件,称为模型文件,以便在预测时使用。
默认情况下,只需要给函数提供一个样本文件名就可以了,但为了能保存结果,还是要提供一个结果文件名,比如:test.mod el,则命令为: svmtrain test.txt test.model
(4)svmpredict的用法
svmpredict是根据训练获得的模型,对数据集合进行预测。
[predict_label, accuracy, prob_values] = svmpredict(testLabel, testData, model, ‘-b 1’); % run the SVM model on the test data
a记录了对应样本识别出来的类别
b正确率以及模型参数
c分类概率
3.经典案例
出现的错误及其原因总结
错误:SVMTRAIN only supports classification into two groups. GROUP contains 21 groups.
原因:没有导入libsvm工具箱,重复安装中的2步骤,运行时要添加到路径。
case1:
%%clean work
tic;%记录运行时间
close all;%关闭所有figure窗口
clear;%清空变量
clc;%清空命令
format compact;%空格紧凑
%生成待回归的数据
x = (-1:0.1:1)';
y = -x.^2;
%建立回归模型
model = svmtrain(y,x,'-s 3 -t 2 -c 2.2 -g 2.8 -p 0.01');
%利用建立的模型看其在训练集上的回归效果
[py,mse,prob] = svmpredict(y,x,model,'-b 0');
figure;%建立一个窗口
plot(x,y,'o');%原始数据以o这种形式标记
hold on;%保持当前图像不刷新
plot(x,py,'r*');%回归数据以红色的*标记
legend('原始数据','回归数据');%设置图例线条
grid on;%画图的时候添加网格线
%进行预测
testx = [1.1;1.2;1.3];
display('真实数据');%控制台输出
testy = -testx.^2
[ptesty,tmse,prob2] = svmpredict(testy,testx,model,'-b 0');
display('预测数据');
ptesty
toc
运行结果:
原博主是通过y=-x^2这个表达式进行训练,在图像上显示原始数据和回归数据。
case2: