SVM训练结果参数说明训练参数说明归一化加快速度和提升准确率归一化还原

原文：http://blog.sina.com.cn/s/blog_57a1cae80101bit5.html

举例说明

　　svmtrain -s 0 -?c 1000 -t 1 -g 1 -r 1 -d 3 data_file 　　训练一个由多项式核（u'v+1）^3和C=1000组成的分类器。　　svmtrain -s 1 -n 0.1 -t 2 -g 0.5 -e 0.00001 data_file 　　在RBF核函数exp(-0.5|u-v|^2）和终止允许限0.00001的条件下，训练一个?-SVM (? = 0.1）分类器。　　svmtrain -s 3 -p 0.1 -t 0 -c 10 data_file 　　以线性核函数u'v和C=10及损失函数?= 0.1求解SVM回归。　　输出如下：　　optimization finished,#iter 　　迭代次数　　epsilon = 　二次规划的终止条件　　obj =, obj，就是那个二次规划的最小值吧　　rho = 判决函数的常数向

　　nSV =, 支持向量的个数

其中value为归一化后的值，其他参数与前面介绍的相同。

建议将训练数据集与测试数据集放在同一个文本文件中一起归一化，然后再将归一化结果分成训练集和测试集。

首先下载Libsvm、Python和Gnuplot：

l libsvm的主页http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 上下载libsvm （我自己用2.86版本）

l python的主页http://www.python.org 下载 python （我自己用2.5版本）

l gnuplot的主页http://www.gnuplot.info/ 下载gnuplot （我用4.0版本）

LIBSVM 使用的一般步骤是：

1）按照LIBSVM软件包所要求的格式准备数据集；

2）对数据进行简单的缩放操作；

3）首要考虑选用RBF 核函数；

4）采用交叉验证选择最佳参数C与g ；

5）采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型；

6）利用获取的模型进行测试与预测。

1）LIBSVM使用的数据格式

该软件使用的训练数据和检验数据文件格式如下：

[label] [index1]:[value1] [index2]:[value2] ...

一行一条记录数据，如:

+1 1:0.708 2:1 3:1 4:-0.320 5:-0.105 6:-1

这里(x,y)à((0.708,1,1, -0.320, -0.105, -1), +1)

label 或说是class, 就是你要分类的种类，通常是一些整数。

index 是有順序的索引，通常是连续的整数。

value 就是用来 train 的数据，通常是一堆实数。

2）对数据进行简单的缩放操作

扫描数据. 因为原始数据可能范围过大或过小, svmscale可以先将数据重新scale (縮放) 到适当范围使训练与预测速度更快。

svmscale.exe的用法：svmscale.exe feature.txt feature.scaled

默认的归一化范围是[-1,1]，可以用参数-l和-u分别调整上界和下届,feature.txt是输入特征文件名输出的归一化特征名为feature.scaled

3）考虑选用RBF 核函数

训练数据形成模型（model）,实质是算出了wx+b=0中的w,b.

Svmtrain的用法：svmtrain [options] training_set_file [model_file]

其中options涵义如下:

-s svm类型：设置SVM 类型，默认值为0，可选类型有：

0 -- C- SVC

1 -- nu - SVC

2 -- one-class-SVM

3 -- e - SVR

4 -- nu-SVR

-t 核函数类型：设置核函数类型，默认值为2，可选类型有：

0 -- 线性核：u'*v

1 -- 多项式核：(g*u'*v+ coef0)degree

2 -- RBF 核:exp(-||u-v||*||u-v||/g*g)

3 -- sigmoid 核：tanh(g*u'*v+ coef 0)

-d degree：核函数中的degree设置，默认值为3；

-g r(gama)：核函数中的函数设置(默认1/ k);

-r coef 0：设置核函数中的coef0，默认值为0；

-c cost：设置C- SVC、e - SVR、n - SVR中从惩罚系数C，默认值为1；

-n nu ：设置nu - SVC、one-class-SVM 与nu - SVR 中参数nu ，默认值0.5；

-p e ：核宽,设置e - SVR的损失函数中的e ，默认值为0.1；

-m cachesize：设置cache内存大小，以MB为单位(默认40)：

-e e ：设置终止准则中的可容忍偏差，默认值为0.001；

-h shrinking：是否使用启发式，可选值为0 或1，默认值为1；

-b 概率估计：是否计算SVC或SVR的概率估计，可选值0 或1，默认0；

-wi weight：对各类样本的惩罚系数C加权，默认值为1；

-v n：n折交叉验证模式。

其中-g选项中的k是指输入数据中的属性数。操作参数 -v 随机地将数据剖分为n 部分并计算交叉检验准确度和均方根误差。以上这些参数设置可以按照SVM 的类型和核函数所支持的参数进行任意组合，如果设置的参数在函数或SVM 类型中没有也不会产生影响，程序不会接受该参数；如果应有的参数设置不正确，参数将采用默认值。training_set_file是要进行训练的数据集；model_file是训练结束后产生的模型文件，该参数如果不设置将采用默认的文件名，也可以设置成自己惯用的文件名。举个例子如下：

C:\libsvm-2.85\windows>svmtrain heart_scale

optimization finished, #iter = 162

nu = 0.431029

obj = -100.877288, rho = 0.424462

nSV = 132, nBSV = 107

Total nSV = 132

现简单对屏幕回显信息进行说明：

#iter为迭代次数，

nu 与前面的操作参数-n nu 相同，

obj为SVM文件转换为的二次规划求解得到的最小值，

rho 为判决函数的常数项b，

nSV 为支持向量个数，

nBSV为边界上的支持向量个数，

Total nSV为支持向量总个数。

训练后的模型保存为文件*.model，用记事本打开其内容如下：

svm_type c_svc % 训练所采用的svm类型，此处为C- SVC

kernel_type rbf %训练采用的核函数类型，此处为RBF核

gamma 0.0769231 %设置核函数中的g ，默认值为1/ k

nr_class 2 %分类时的类别数，此处为两分类问题

total_sv 132 %总共的支持向量个数

rho 0.424462 %决策函数中的常数项b

label 1 -1%类别标签

nr_sv 64 68 %各类别标签对应的支持向量个数

SV %以下为支持向量

1 1:0.166667 2:1 3:-0.333333 4:-0.433962 5:-0.383562 6:-1 7:-1 8:0.0687023 9:-1 10:-0.903226 11:-1 12:-1 13:1

0.5104832128985164 1:0.125 2:1 3:0.333333 4:-0.320755 5:-0.406393 6:1 7:1 8:0.0839695 9:1 10:-0.806452 12:-0.333333 13:0.5

1 1:0.333333 2:1 3:-1 4:-0.245283 5:-0.506849 6:-1 7:-1 8:0.129771 9:-1 10:-0.16129 12:0.333333 13:-1

1 1:0.208333 2:1 3:0.333333 4:-0.660377 5:-0.525114 6:-1 7:1 8:0.435115 9:-1 10:-0.193548 12:-0.333333 13:1

4）采用交叉验证选择最佳参数C与g

通常而言，比较重要的参数是 gamma (-g) 跟 cost (-c) 。而 cross validation (-v)

的参数常用5。那么如何去选取最优的参数c和g呢？libsvm 的 python 子目录下面的 grid.py 可以帮助我们。此时。其中安装python2.5需要（一般默认安装到c:\python25

下），将gnuplot解压。安装解压完毕后，进入\libsvm\tools目录下，用文本编辑器（记事

本，edit都可以）修改grid.py文件，找到其中关于gnuplot路径的那项（其默认路径为

gnuplot_exe=r"c:\tmp\gnuplot\bin\pgnuplot.exe"），根据实际路径进行修改，并保存。然

后，将grid.py和C:\Python25目录下的python.exe文件拷贝到libsvm\windows目录下，键入以下命令：$ python grid.py train.1.scale 执行后，即可得到最优参数c和g。

另外，至于下libsvm和python的接口的问题，在libsvm2.86中林老师已经帮助我们解决，在\libsvm\windows\python目录下自带了svmc.pyd这个文件，将该文件文件复制到

libsvm\python目录下，同时，也将python.exe文件复制到该目录下，键入以下命令以检验效

果（注意：.Py文件中关于gnuplot路径的那项路径一定要根据实际路径修改）：

python svm_test.py

如果能看到程序执行结果，说明libsvm和python之间的接口已经配置完成，以后就可以直接在python程序里调用libsvm的函数了！

5）采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型

$ svmtrain –c x –g x –v x training_set_file [model_file]

x为上述得到的最优参数c和g的值，v的值一般取5。

6）利用获取的模型进行测试与预测

使用Svmtrain训练好的模型进行测试。输入新的X值，给出SVM预测出的Y值

$ Svmpredict test_file model_file output_file

如：./svm-predict heart_scale heart_scale.model heart_scale.out

Accuracy = 86.6667% (234/270) (classification)

这里显示的是结果

一个具体使用的例子。

以libsvm中的heart_scale作为训练数据和测试数据，同时已经将python安装至c盘，并将grid.py文件中关于gnuplot路径的默认值修改为实际解压缩后的路径，将

heart_scale、grid.py和python.exe拷贝至\libsvm\windows文件夹下。

./svm-train heart_scale

optimization finished, #iter = 162

nu = 0.431029

obj = -100.877288, rho = 0.424462

nSV = 132, nBSV = 107

Total nSV = 132

此时，已经得到heart_scale.model，进行预测：

./svm-predict heart_scale heart_scale.model heart_scale.out

Accuracy = 86.6667% (234/270) (classification)

正确率为Accuracy = 86.6667%。

./python grid.py heart_scale

得到最优参数c=2048，g=0.0001220703125.

./svm-train -c 2048 -g 0.0001220703125 heart_scale得到model后，由./svm-predict heart_scale heart_scale.model heart_scale.out得到的正确

率为Accuracy = 85.1852%.这块还有点迷惑？为什么正确率降低了？

当然也可以结合subset.py 和 easy.py 实现自动化过程。

如果要训练多次，可以写个批处理程序省好多事。

这里举个例子：

::@ echo off
cls
:: split the data and output the results
for /L %%i in (1,1,1000) do python subset.py b59.txt 546 b59(%%i).in8 b59(%%i).out2

for /L %%i in (1,1,1000) do python easy.py b59(%%i).in8 b59(%%i).out2 >> result89.txt

这段批处理代码首先调用subset.py对文件b59.txt执行1000次分层随机抽样(对数据进行80-20%分割)然后调用easy.py 进行1000次参数寻优，把记录结果写到result89.txt中

（包括1000次训练的分类准确率和参数对）。

还可以调用fselect.py进行特征选择，调用plotroc.py进行roc曲线绘制。

1.首先从主页上下载libsvm、Python2.5.2和gnuplot 三个软件。

http://www.csie.ntu.edu.tw/~cjlin/

2.准备好数据，首先要把数据转换成Libsvm软件包要求的数据格式为：

label index1:value1 index2:value2 ...

其中对于分类来说label为类标识，指定数据的种类；对于回归来说label为目标值。（我主要要用到回归）

Index是从1开始的自然数，value是每一维的特征值。

该过程可以自己使用excel或者编写程序来完成，也可以使用网络上的FormatDataLibsvm.xls来完成。

FormatDataLibsvm.xls使用说明：

先将数据按照下列格式存放（注意label放最后面）：

value1 value2 ?? label

然后将以上数据粘贴到FormatDataLibsvm.xls中的最左上角单元格，接着工具->宏执行行FormatDataToLibsvm宏。就可以得到libsvm要求的数据格式。将该数据存放到文本文件中进行下一步的处理。

3.对数据进行归一化。

该过程要用到libsvm软件包中的svm-scale.exe

Svm-scale用法：

用法：svmscale [-l lower] [-u upper] [-y y_lower y_upper] [-s save_filename] [-r restore_filename] filename （缺省值： lower = -1，upper = 1，没有对y进行缩放）其中， -l：数据下限标记；lower：缩放后数据下限； -u：数据上限标记；upper：缩放后数据上限； -y：是否对目标值同时进行缩放；y_lower为下限值，y_upper为上限值；（回归需要对目标进行缩放，因此该参数可以设定为 –y -1 1 ） -s save_filename：表示将缩放的规则保存为文件save_filename； -r restore_filename：表示将缩放规则文件restore_filename载入后按此缩放； filename：待缩放的数据文件（要求满足前面所述的格式）。

缩放规则文件可以用文本浏览器打开，看到其格式为：

lower upper min max x

lower upper

index1 min1 max1

index2 min2 max2

?? 其中的lower 与upper 与使用时所设置的lower 与upper 含义相同；index 表示特征序号；min 转换前该特征的最小值；max 转换前该特征的最大值。数据集的缩放结果在此情况下通过DOS窗口输出，当然也可以通过DOS的文件重定向符号“>”将结果另存为指定的文件。该文件中的参数可用于最后面对目标值的反归一化。反归一化的公式为：

（Value-lower）*（max-min）/(upper - lower)+lower

以上内容是网上找到的，反归一化公式是错误的，应该是：

（Value-lower）*（max-min）/(upper - lower)+min

其中value为归一化后的值，其他参数与前面介绍的相同。

建议将训练数据集与测试数据集放在同一个文本文件中一起归一化，然后再将归一化结果分成训练集和测试集。

4.训练数据，生成模型。

用法： svmtrain [options] training_set_file [model_file]

其中， options（操作参数）：可用的选项即表示的涵义如下所示 -s svm类型：设置SVM 类型，默认值为0，可选类型有（对于回归只能选3或4）：

0 -- C- SVC 1 -- n - SVC 2 -- one-class-SVM 3 -- e - SVR 4 -- n - SVR -t 核函数类型：设置核函数类型，默认值为2，可选类型有： 0 -- 线性核：u'*v 1 -- 多项式核： (g*u'*v+ coef 0)deg ree 2 -- RBF 核：e( u v 2) g - 3 -- sigmoid 核：tanh(g*u'*v+ coef 0) -d degree：核函数中的degree设置，默认值为3；

-g g ：设置核函数中的g ，默认值为1/ k ； -r coef 0：设置核函数中的coef 0，默认值为0； -c cost：设置C- SVC、e - SVR、n - SVR中从惩罚系数C，默认值为1； -n n ：设置n - SVC、one-class-SVM 与n - SVR 中参数n ，默认值0.5； -p e ：设置n - SVR的损失函数中的e ，默认值为0.1； -m cachesize：设置cache内存大小，以MB为单位，默认值为40； -e e ：设置终止准则中的可容忍偏差，默认值为0.001； -h shrinking：是否使用启发式，可选值为0 或1，默认值为1； -b 概率估计：是否计算SVC或SVR的概率估计，可选值0 或1，默认0； -wi weight：对各类样本的惩罚系数C加权，默认值为1； -v n：n折交叉验证模式。

本实验中的参数-s取3，-t取2（默认）还需确定的参数是-c，-g，-p

另，实验中所需调整的重要参数是-c 和 –g，-c和-g的调整除了自己根据经验试之外，还可以使用gridregression.py对这两个参数进行优化。（需要补充）

该优化过程需要用到Python（2.5），Gnuplot（4.2），gridregression.py（该文件需要修改路径）。

然后在命令行下面运行：

python.exe gridregression.py -log2c -10,10,1 -log2g -10,10,1 -log2p -10,10,1 -s 3 –t 2 -v 5 -svmtrain E:\libsvm\libsvm-2.86\windows\svm-train.exe -gnuplot E:\libsvm\libsvm-2.86\gnuplot\bin\pgnuplot.exe E:\libsvm\libsvm-2.86\windows\train.txt > gridregression_feature.parameter

以上三个路径根据实际安装情况进行修改。

-log2c是给出参数c的范围和步长 -log2g是给出参数g的范围和步长 -log2p是给出参数p的范围和步长上面三个参数可以用默认范围和步长 -s选择SVM类型，也是只能选3或者4 -t是选择核函数 -v 10 将训练数据分成10份做交叉验证。默认为5

为了方便将gridregression.py是存放在python.exe安装目录下

trian.txt为训练数据，参数存放在gridregression_feature.parameter中，可以自己命名。

搜索结束后可以在gridregression_feature.parameter中最后一行看到最优参数。

其中，最后一行的第一个参数即为-c，第二个为-g，第三个为-p，最后一个参数为均方误差。前三个参数可以直接用于模型的训练。

然后，根据搜索得到的参数，重新训练，得到模型。

5.测试

用法：svmpredict [options] test_file model_file output_file options（操作参数）： -b probability_estimates：是否需要进行概率估计预测，可选值为0 或者1，默认值为0。 model_file 是由svmtrain 产生的模型文件；

test_file 是要进行预测的数据文件；

output_file 是svmpredict 的输出文件，表示预测的结果值。

输出结果包括均方误差（Mean squared error）和相关系数（Squared correlation coefficient）。

用LIBSVM做回归和预测的步骤（请指点）

首先说明，我学习SVM才几天，对基本理论还不了解，只是想利用这一工具做自己想做的事情。摸索着做了几个实验，试着把过程写下来，请大家指点。

<1> 下载Libsvm、Python和Gnuplot。我用的版本分别是：Libsvm（2.8.1），Python（2.4），Gnuplot（3.7.3）。注意：Gnuplot一定要用3.7.3版，3.7.1版的有bug.

<2> 修改训练和测试数据的格式（可以自己用perl编个小程序）：

目标值第一维特征编号：第一维特征值第二维特征编号：第二维特征值 …

…

例如：

2.3 1:5.6 2:3.2

表示训练用的特征有两维，第一维是5.6，第二维是3.2，目标值是2.3

注意：训练和测试数据的格式必须相同，都如上所示。测试数据中的目标值是为了计算误差用

<3> 分别使用Libsvm中的Windows版本的工具svmscale.exe进行训练和测试数据的归一化，svmtrain.exe进行模型训练，svmpredict.exe进行预测

（1）svmscale.exe的用法：svmscale.exe feature.txt feature.scaled

默认的归一化范围是[－1，1]，可以用参数-l和-u分别调整上界和下届,feature.txt是输入特征文件名

输出的归一化特征名为feature.scaled

（2）svmtrtrain.exe训练模型

我习惯写个批处理小程序，处理起来比较方便。例如svm_train.bat中训练语句为：

svmtrain.exe -s 3 -p 0.0001 -t 2 -g 32 -c 0.53125 -n 0.99 feature.scaled

训练得到的模型为feature.scaled.model

具体的参数含义可以参考帮助文档。这里-s是选择SVM的类型。对于回归来说，只能选3或者 4，3表示epsilon-support vector regression, 4表示nu-support vector regression。-t是选择核函数，通常选用RBF核函数，原因在“A Practical Guide support vector classification”中已经简单介绍过了。-p尽量选个比较小的数字。需要仔细调整的重要参数是-c和-g。除非用 gridregression.py来搜索最优参数，否则只能自己慢慢试了。

用gridregression.py搜索最优参数的方法如下：

python.exe gridregression.py -svmtrain H:\SVM\libsvm-2.81\windows\svmtrain.exe -gnuplot C:\gp373w32\pgnuplot.exe -log2c -10,10,1 -log2g -10,10,1 -log2p -10,10,1 -v 10 -s 3 -t 2 H:\SVM\libsvm-2.81\windows\feature.scaled > gridregression_feature.parameter

注意：-svmtrain是给出svmtrain.exe所在路径，一定要是完整的全路径

-gnuplot是给出pgnuplot.exe所在路径。这里要用pgnuplot.exe这种命令行形式的，不要用wgnupl32.exe，这个是图形界面的。

-log2c是给出参数c的范围和步长

-log2g是给出参数g的范围和步长

-log2p是给出参数p的范围和步长

上面三个参数可以用默认范围和步长

-s选择SVM类型，也是只能选3或者4

-t是选择核函数

-v 10 将训练数据分成10份做交叉验证。默认为5

最后给出归一化后训练数据的全路径

搜索最优参数的过程写入文件gridregression_feature.parameter（注意别少了这个>符号啊）

根据搜索到的最优参数修改feature.scaled.model中的参数

（3）用svmpredict.exe进行预测

svmpredict.exe feature_test.scaled feature.scaled.model feature_test.predicted

其中feature_test.scaled是归一化后的测试特征文件名，feature.scaled.model是训练好的模型，SVM预测的值在feature_test.predicted中

核函数方法简介

（1）核函数发展历史

早在1964年Aizermann等在势函数方法的研究中就将该技术引入到机器学习领域，但是直到1992年Vapnik等利用该技术成功地将线性 SVMs推广到非线性SVMs时其潜力才得以充分挖掘。而核函数的理论则更为古老，Mercer定理可以追溯到1909年，再生核希尔伯特空间 (ReproducingKernel Hilbert Space, RKHS)研究是在20世纪40年代开始的。

（2）核函数方法原理

根据模式识别理论，低维空间线性不可分的模式通过非线性映射到高维特征空间则可能实现线性可分，但是如果直接采用这种技术在高维空间进行分类或回归，则存在确定非线性映射函数的形式和参数、特征空间维数等问题，而最大的障碍则是在高维特征空间运算时存在的“维数灾难”。采用核函数技术可以有效地解决这样问题。

设x,z∈X,X属于R（n）空间,非线性函数Φ实现输入间X到特征空间F的映射,其中F属于R（m）,n<<m。根据核函数技术有：

K(x,z) =<Φ(x),Φ(z) > (1)

其中：<, >为内积,K(x,z)为核函数。从式(1)可以看出，核函数将m维高维空间的内积运算转化为n维低维输入空间的核函数计算，从而巧妙地解决了在高维特征空间中计算的“维数灾难”等问题，从而为在高维特征空间解决复杂的分类或回归问题奠定了理论基础。

（3）核函数特点

核函数方法的广泛应用,与其特点是分不开的：

1）核函数的引入避免了“维数灾难”,大大减小了计算量。而输入空间的维数n对核函数矩阵无影响，因此，核函数方法可以有效处理高维输入。

2）无需知道非线性变换函数Φ的形式和参数.

3）核函数的形式和参数的变化会隐式地改变从输入空间到特征空间的映射，进而对特征空间的性质产生影响，最终改变各种核函数方法的性能。

4）核函数方法可以和不同的算法相结合，形成多种不同的基于核函数技术的方法，且这两部分的设计可以单独进行，并可以为不同的应用选择不同的核函数和算法。

（4）常见核函数

核函数的确定并不困难,满足Mercer定理的函数都可以作为核函数。常用的核函数可分为两类，即内积核函数和平移不变核函数，如：

　1）高斯核函数K(x,xi) =exp(-||x-xi||2/2σ2；

2）多项式核函数K(x,xi)=(x·xi+1)^d, d=1,2,…,N；

3）感知器核函数K(x,xi) =tanh(βxi+b)；

4）样条核函数K(x,xi) = B2n+1(x-xi)。

（5）核函数方法实施步骤

核函数方法是一种模块化(Modularity)方法，它可分为核函数设计和算法设计两个部分，具体为：

1）收集和整理样本,并进行标准化；

2）选择或构造核函数；

3）用核函数将样本变换成为核函数矩阵,这一步相当于将输入数据通过非线性函数映射到高维

特征空间；

4）在特征空间对核函数矩阵实施各种线性算法；

5）得到输入空间中的非线性模型。

显然,将样本数据核化成核函数矩阵是核函数方法中的关键。注意到核函数矩阵是l×l的对称矩阵，其中l为样本数。

（6）核函数在模式识别中的应用

1）新方法。主要用在基于结构风险最小化(Structural Risk Minimization,SRM)的SVM中。

2）传统方法改造。如核主元分析(kernel PCA)、核主元回归(kernel PCR)、核部分最小二乘法(kernel PLS)、核Fisher判别分析(Kernel Fisher Discriminator, KFD)、核独立主元分析(Kernel Independent Component Analysis,KICA)等，这些方法在模式识别等不同领域的应用中都表现了很好的性能。

许多想用lib-svm解决分类或者回归的初学者可能像我一样一开始摸不着头绪。面对长篇的english，头都大了。有好心人把自己的经验总结了，我们就一起共享吧！

1. LIBSVM 软件包简介

LIBSVM 是台湾大学林智仁(Chih-Jen Lin)博士等开发设计的一个操作简单、易于使用、快速有效的通用SVM 软件包，可以解决分类问题（包括C- SVC、n - SVC ）、回归问题（包括e - SVR、n - SVR ）以及分布估计（one-class-SVM ）等问题，提供了线性、多项式、径向基和S形函数四种常用的核函数供选择，可以有效地解决多类问题、交叉验证选择参数、对不平衡样本加权、多类问题的概率估计等。LIBSVM 是一个开源的软件包，需要者都可以免费的从作者的个人主页http://www.csie.ntu.edu.tw/~cjlin/ 处获得。他不仅提供了LIBSVM的C++语言的算法源代码，还提供了Python、Java、R、MATLAB、Perl、Ruby、LabVIEW以及C#.net 等各种语言的接口，可以方便的在Windows 或UNIX 平台下使用，也便于科研工作者根据自己的需要进行改进（譬如设计使用符合自己特定问题需要的核函数等）。另外还提供了WINDOWS 平台下的可视化操作工具SVM-toy，并且在进行模型参数选择时可以绘制出交叉验证精度的等高线图。

2. LIBSVM 使用方法简介

LIBSVM 在给出源代码的同时还提供了Windows操作系统下的可执行文件，包括：进行支持向量机训练的svmtrain.exe；根据已获得的支持向量机模型对数据集进行预测的svmpredict.exe；以及对训练数据与测试数据进行简单缩操作的svmscale.exe。它们都可以直接在DOS 环境中使用。如果下载的包中只有C++的源代码，则也可以自己在VC等软件上编译生成可执行文件。

LIBSVM 使用的一般步骤是：

1）按照LIBSVM软件包所要求的格式准备数据集；

2）对数据进行简单的缩放操作；

3）考虑选用RBF 核函数2 K(x,y) e x y = -g - ；

4）采用交叉验证选择最佳参数C与g ；

5）采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型；

6）利用获取的模型进行测试与预测。

一. LIBSVM 使用的数据格式

LIBSVM使用的训练数据和测试数据文件格式如下：

：：< 2> …

其中是训练数据集的目标值，对于分类，它是标识某类的整数(支持

多个类)；对于回归，是任意实数。

是以1 开始的整数，表示特征的序号；
为实数，也就是我们常说的特征值或自变量。当特征值为0 时，特征序号与特征值都可以同时省略，即index可以是不连续的自然数。
与第一个特征序号、前一个特征值与后一个特征序号之间用空格隔开。测试数据文件中的label 只用于计算准确度或误差，如果它是未知的，只需用任意一个数填写这一栏，也可以空着不填。例如：

+1 1:0.708 2:1 3:1 4:-0.320 5:-0.105 6:-1 8:1.21

二. svmscale 的用法

对数据集进行缩放的目的在于：

1）避免一些特征值范围过大而另一些特征值范围过小；

2）避免在训练时为了计算核函数而计算内积的时候引起数值计算的困难。因此，通常将数据缩放到[ -1,1]或者是[0,1]之间。

用法：svmscale [-l lower] [-u upper] [-y y_lower y_upper][-s save_filename] [-r restore_filename] filename

（缺省值： lower = -1，upper = 1，没有对y进行缩放）

其中，

-l：数据下限标记；lower：缩放后数据下限；

-u：数据上限标记；upper：缩放后数据上限；

-y：是否对目标值同时进行缩放；y_lower为下限值，y_upper为上限值；

-s save_filename：表示将缩放的规则保存为文件save_filename；

-r restore_filename：表示将缩放规则文件restore_filename载入后按此缩放；

filename：待缩放的数据文件（要求满足前面所述的格式）。

缩放规则文件可以用文本浏览器打开，看到其格式为：

lower upper

lval1 uval1

lval2 uval2

其中的lower 与upper 与使用时所设置的lower 与upper 含义相同；index 表示特征序号；lval 为该特征对应转换后下限lower 的特征值；uval 为对应于转换后上限upper 的特征值。数据集的缩放结果在此情况下通过DOS窗口输出，当然也可以通过DOS的文件重定向符号“>”将结果另存为指定的文件。

使用实例：

1) svmscale –s train3.range train3>train3.scale

表示采用缺省值（即对属性值缩放到[ -1,1]的范围，对目标值不进行缩放）对数据集train3 进行缩放操作，其结果缩放规则文件保存为train3.range，缩放集的缩放结果保存为train3.scale。

2） svmscale –r train3.range test3>test3.scale

表示载入缩放规则train3.range 后按照其上下限对应的特征值和上下限值线性的地对数据集test3 进行缩放，结果保存为test3.scale。

三. svmtrain 的用法

svmtrain实现对训练数据集的训练，获得SVM模型。

用法： svmtrain [options] training_set_file [model_file]

其中，

options（操作参数）：可用的选项即表示的涵义如下所示

-s svm类型：设置SVM 类型，默认值为0，可选类型有：

0 -- C- SVC

1 -- n - SVC

2 -- one-class-SVM

3 -- e - SVR

4 -- n - SVR

-t 核函数类型：设置核函数类型，默认值为2，可选类型有：

0 -- 线性核：u'*v

1 -- 多项式核： (g*u'*v+ coef 0)deg ree

2 -- RBF 核：e( u v 2) g -

3 -- sigmoid 核：tanh(g*u'*v+ coef 0)

-d degree：核函数中的degree设置，默认值为3； -g g ：设置核函数中的g ，默认值为1/ k ；

-r coef 0：设置核函数中的coef 0，默认值为0；

-c cost：设置C- SVC、e - SVR、n - SVR中从惩罚系数C，默认值为1；

-n n ：设置n - SVC、one-class-SVM 与n - SVR 中参数n ，默认值0.5；

-p e ：设置n - SVR的损失函数中的e ，默认值为0.1；

-m cachesize：设置cache内存大小，以MB为单位，默认值为40；

-e e ：设置终止准则中的可容忍偏差，默认值为0.001；

-h shrinking：是否使用启发式，可选值为0 或1，默认值为1；

-b 概率估计：是否计算SVC或SVR的概率估计，可选值0 或1，默认0；

-wi weight：对各类样本的惩罚系数C加权，默认值为1；

-v n：n折交叉验证模式。

其中-g选项中的k是指输入数据中的属性数。操作参数 -v 随机地将数据剖分为n 部分并计算交叉检验准确度和均方根误差。以上这些参数设置可以按照SVM 的类型和核函数所支持的参数进行任意组合，如果设置的参数在函数或SVM 类型中没有也不会产生影响，程序不会接受该参数；如果应有的参数设置不正确，参数将采用默认值。training_set_file是要进行训练的数据集；model_file是训练结束后产生的模型文件，该参数如果不设置将采用默认的文件名，也可以设置成自己惯用的文件名。

四. svmpredict 的用法

svmpredict 是根据训练获得的模型，对数据集合进行预测。

用法：svmpredict [options] test_file model_file output_file

options（操作参数）：

-b probability_estimates：是否需要进行概率估计预测，可选值为0 或者1，

默认值为0。

model_file 是由svmtrain 产生的模型文件；test_file 是要进行预测的数据文

件；output_file 是svmpredict 的输出文件，表示预测的结果值。svmpredict 没有其它的选项。

因为要用svm做regression，所以看了一些关于libsvm，总结以备用

libsvm在训练model的时候，有如下参数要设置，当然有默认的参数，但是在具体应用方面效果会大大折扣。

Options：可用的选项即表示的涵义如下
　　-s svm类型：SVM设置类型(默认0)
　　0 -- C-SVC
　　1 --v-SVC
　　2 – 一类SVM
　　3 -- e -SVR
　　4 -- v-SVR

　　-t 核函数类型：核函数设置类型(默认2)
　　0 – 线性：u'v
　　1 – 多项式：(r*u'v + coef0)^degree
　　2 – RBF函数：exp(-gamma|u-v|^2)
　　3 –sigmoid：tanh(r*u'v + coef0)

　　-d degree：核函数中的degree设置(针对多项式核函数)(默认3)
　　-g r(gama)：核函数中的gamma函数设置(针对多项式/rbf/sigmoid核函数)(默认1/ k)
　　-r coef0：核函数中的coef0设置(针对多项式/sigmoid核函数)((默认0)
　　-c cost：设置C-SVC，e -SVR和v-SVR的参数(损失函数)(默认1)
　　-n nu：设置v-SVC，一类SVM和v- SVR的参数(默认0.5)
　　-p p：设置e -SVR 中损失函数p的值(默认0.1)
　　-m cachesize：设置cache内存大小，以MB为单位(默认40)
　　-e eps：设置允许的终止判据(默认0.001)
　　-h shrinking：是否使用启发式，0或1(默认1)
　　-wi weight：设置第几类的参数C为weight*C(C-SVC中的C)(默认1)
　　-v n: n-fold交互检验模式，n为fold的个数，必须大于等于2
　　其中-g选项中的k是指输入数据中的属性数。option -v 随机地将数据剖分为n部

当构建完成model后，还要为上述参数选择合适的值，方法主要有Gridsearch,其他的感觉不常用，Gridsearch说白了就是穷举。

网格参数寻优函数(分类问题):SVMcgForClass
[bestCVaccuracy,bestc,bestg]=
SVMcgForClass(train_label,train,
cmin,cmax,gmin,gmax,v,cstep,gstep,accstep)
输入：
train_label:训练集的标签，格式要求与svmtrain相同。
train:训练集，格式要求与svmtrain相同。
cmin,cmax:惩罚参数c的变化范围，即在[2^cmin,2^cmax]范围内寻找最佳的参数c，默认值为cmin=-8，cmax=8，即默认惩罚参数c的范围是[2^(-8),2^8]。
gmin,gmax:RBF核参数g的变化范围，即在[2^gmin,2^gmax]范围内寻找最佳的RBF核参数g，默认值为gmin=-8，gmax=8，即默认RBF核参数g的范围是[2^(-8),2^8]。
v:进行Cross Validation过程中的参数，即对训练集进行v-fold Cross Validation，默认为3，即默认进行3折CV过程。
cstep,gstep:进行参数寻优是c和g的步进大小，即c的取值为2^cmin,2^(cmin+cstep),…,2^cmax,，g的取值为2^gmin,2^(gmin+gstep),…,2^gmax，默认取值为cstep=1,gstep=1。
accstep:最后参数选择结果图中准确率离散化显示的步进间隔大小（[0,100]之间的一个数），默认为4.5。
输出：
bestCVaccuracy:最终CV意义下的最佳分类准确率。
bestc:最佳的参数c。
bestg:最佳的参数g。

网格参数寻优函数(回归问题):SVMcgForRegress
[bestCVmse,bestc,bestg]=
SVMcgForRegress(train_label,train,
cmin,cmax,gmin,gmax,v,cstep,gstep,msestep)
其输入输出与SVMcgForClass类似，这里不再赘述。

而当你训练完了model，在用它做classification或regression之前，应该知道model中的内容，以及其含义。

用来训练的是libsvm自带的heart数据

model =
    Parameters: [5x1 double]
      nr_class: 2
       totalSV: 259                   % 支持向量的数目
           rho: 0.0514               % b
         Label: [2x1 double]     % classification中标签的个数
         ProbA: []
         ProbB: []
           nSV: [2x1 double]     % 每类支持向量的个数
        sv_coef: [259x1 double] %   支持向量对应的Wi

SVs: [259x13 double] % 装的是259个支持向量

model.Parameters参数意义从上到下依次为：
-s svm类型：SVM设置类型(默认0)
-t 核函数类型：核函数设置类型(默认2)
-d degree：核函数中的degree设置(针对多项式核函数)(默认3)
-g r(gama)：核函数中的gamma函数设置(针对多项式/rbf/sigmoid核函数) (默认类别数目的倒数)
-r coef0：核函数中的coef0设置(针对多项式/sigmoid核函数)((默认0)

SVM 怎样能得到好的结果

1. 对数据做归一化（simple scaling）

2. 应用 RBF kernel

3. 用cross-validation和grid-search 得到最优的c和g

4. 用得到的最优c和g训练训练数据

5. 测试

分并计算交互检验准确度和均方根误差。以上这些参数设置可以按照SVM的类型和核函

数所支持的参数进行任意组合，如果设置的参数在函数或SVM类型中没有也不会产生影

响，程序不会接受该参数；如果应有的参数设置不正确，参数将采用默认值。

你可能感兴趣的:(SVM)

Python dlib（HOG+SVM）人脸识别总结程序媛一枚~ 人脸识别 python 支持向量机开发语言读书笔记人脸检测识别
Pythondlib（HOG+SVM）人脸识别总结面部标志检测dlib68点（HOG+SVM），194点人脸识别模型，包括口（外嘴唇，内嘴唇），鼻，眉毛（左右眉），眼睛（左右眼），下鄂5点面部标志检测器（左眼2点，右眼2点，鼻子1点）面部对齐更高效眨眼检测ear眨眼瞬间达到0疲劳驾驶检测—连续帧ear面部对齐眼睛连线反正切获取旋转角度，期望图像眼睛横长度计算比率左眼计算右眼相对坐标眼睛横中心点作为
基于MATLAB图像特征识别及提取实现图像分类 jghhh01 机器学习算法人工智能
基于MATLAB的图形处理程序，可以进行图像特征识别及提取，进而实现图像分类。hog_svm.m,2276svm_images/test_image/1.jpg,20980svm_images/test_image/2.jpg,18246svm_images/test_image/3.jpg,13835svm_images/test_image/4.jpg,18539svm_images/test
Pyeeg模块部分功能介绍脑电情绪识别脑电情绪识别 python 神经网络深度学习 pycharm
1.pyeeg简单介绍PyEEG是一个Python模块（即函数库），用于提取EEG（脑电）特征。正在添加更多功能。它包含构建用于特征提取的数据的函数，例如从给定的时间序列构建嵌入序列。它还能够将功能导出为svmlight格式，以便调用机器学习及深度学习工具。2.部分函数介绍1.pyeeg.ap_entropy(X,M,R)pyeeg.ap_entropy(X, M, R)计算时间序列X的近似熵（A
基于传统机器学习SVM支持向量机进行分类和目标检测-视频介绍下自取 no_work 深度学习机器学习支持向量机分类
内容包括：python通过SVM+SIFT实现墙体裂缝检测107python通过SVM+SIFT实现墙体裂缝检测_哔哩哔哩_bilibili该代码使用python语言编写，代码实现了一个基于SVM（支持向量机）和SIFT（尺度不变特征变换）特征的裂缝检测系统。具体来说，分为两个部分：训练部分和检测部分。训练部分：加载图像：load_images函数从指定文件夹加载图像，并为每张图像分配标签（1表示
SVM支持向量机python实现努力的小巴掌经典机器学习支持向量机
支持向量机（SupportVectorMachine,SVM）是一种强大的监督学习算法，主要用于分类和回归任务。SVM的核心思想是找到一个最优的超平面，使得不同类别的数据点能够被尽可能清晰地分开，并且这个超平面与最近的数据点之间有最大的间隔。这些最近的数据点被称为“支持向量”，因为它们决定了超平面的位置和方向。支持向量机的关键概念1.**最大间隔分离器**：-SVM的目标是找到一个超平面，该超平面
核方法、核技巧、核函数、核矩阵第六五签数学模型矩阵线性代数
核方法（KernelMethods）和核技巧（KernelTrick）是机器学习中处理非线性问题的强大理论框架和实践工具。核心目标：征服非线性许多机器学习算法（如感知机、支持向量机SVM、主成分分析PCA）本质上是寻找线性模式或线性决策边界（直线/平面/超平面）。然而，现实世界的数据往往是线性不可分的，这意味着在原始特征空间中，无法用一条直线（或超平面）完美地将不同类别的数据点分开，或者无法用线性
划界与分类的艺术：支持向量机（SVM）的深度解析忘梓. 杂文支持向量机分类机器学习
划界与分类的艺术：支持向量机（SVM）的深度解析1.引言支持向量机（SupportVectorMachine,SVM）是机器学习中的经典算法，以其强大的分类和回归能力在众多领域得到了广泛应用。SVM通过找到最优超平面来分隔数据，从而实现高效的分类。然而，它在高维数据中的复杂性和核方法的使用也带来了挑战。本文将深入探讨SVM的工作原理、实现技巧、适用场景及其局限性。2.SVM的数学基础与直观理解SV
基于CIFAR-10图像数据集的图像分类算法——MATLAB仿真代码探险狂人分类 matlab 机器学习 Matlab
基于CIFAR-10图像数据集的图像分类算法——MATLAB仿真图像分类是计算机视觉领域中的重要任务之一，它的目标是将输入的图像分到不同的预定义类别中。在本文中，我们将介绍一种基于CIFAR-10图像数据集和支持向量机（SVM）的图像分类算法，并使用MATLAB进行仿真实现。CIFAR-10是一个常用的图像分类数据集，它包含了10个不同类别的60000个32x32彩色图像。这些类别包括飞机、汽车、
BERT 模型微调与传统机器学习的对比 MYH516 bert 机器学习人工智能
BERT微调与传统机器学习的区别和联系：传统机器学习流程传统机器学习处理文本分类通常包含以下步骤：特征工程：手动设计特征（如TF-IDF、词袋模型）模型训练：使用分类器（如SVM、随机森林、逻辑回归）特征和模型调优：反复调整特征和超参数BERT微调流程BERT微调的典型流程：预训练：使用大规模无标注数据预训练BERT模型数据准备：将文本转换为BERT输入格式（tokenize、添加特殊标记）模型微
《Image Classification with Classic and Deep Learning Techniques》复现几何心凉 IT优质推荐深度学习人工智能
1引言图像分类作为计算机视觉领域的核心任务，旨在将输入图像映射到离散化的语义类别标签，广泛应用于人脸识别、自动驾驶、医疗影像诊断、安防监控等场景。传统方法主要依赖手工设计的特征描述子（如SIFT、HOG、LBP）结合浅层模型（如BoVW、Fisher向量、SVM），以其可解释性和低资源消耗见长，但在端到端优化与高级表征能力方面不及深度学习。近年来，卷积神经网络（CNN）在大规模数据集（如Image
AI入门——AI大模型、深度学习、机器学习总结超级-码力人工智能深度学习机器学习 AIGC
以下是对AI深度学习、机器学习相关核心技术的总结与拓展，结合技术演进逻辑与前沿趋势，以全新视角呈现关键知识点一、深度学习：从感知到认知的技术革命核心突破：自动化特征工程的范式变革深度学习通过多层神经网络架构（如卷积神经网络CNN、循环神经网络RNN），实现了从原始数据中自主学习分层特征的能力。相较于传统机器学习依赖人工设计特征（如SVM的核函数、手工提取的图像边缘特征），其核心优势体现在：层次化抽
OpenCV零基础极速入门：详解跨平台安装与环境配置（一） WHCIS opencv opencv 人工智能计算机视觉
一、深入理解OpenCV技术生态1.1OpenCV架构解析OpenCV采用模块化设计，核心架构分为四大层次：核心模块（Core）：矩阵运算、文件IO、基础数据结构图像处理（Imgproc）：滤波、几何变换、特征检测高级视觉（Highgui）：GUI交互、视频流处理机器学习（ML）：SVM、决策树、神经网络1.2版本选择策略版本类型适用场景典型版本基础版快速原型开发opencv-python4.9.
【统计方法】基础分类器: logistic, knn, svm, lda pen-ai 数据科学支持向量机算法机器学习
均方误差（MSE）理解与分解在监督学习中，均方误差衡量的是预测值与实际值之间的平均平方差：MSE=E[(Y−f^(X))2]\text{MSE}=\mathbb{E}[(Y-\hat{f}(X))^2]MSE=E[(Y−f^(X))2]MSE可以分解为三部分：MSE=Bias2(f^(x0))+Var(f^(x0))+Var(ε)\text{MSE}=\text{Bias}^2(\hat{f}(x
08_预处理与缩放白杆杆红伞伞 machine learning 机器学习支持向量机人工智能
描述机器学习的一些算法（如神经网络、SVM）对数据缩放非常敏感。通常的做法是对特征进行调节，使数据表示更适合与这些算法。scikit-learn中提供了4中数据缩放方法：StandardScaler：确保每个特征平均值为0，方差为1，使所有特征都位于同一量级RobusScaler：工作原理与StandardScaler类似，确保每个特性的统计属性都位于同一范围MinMaxScaler：移动数据，使
python怎么训练模型_python svm 怎么训练模型 weixin_39529903 python怎么训练模型
展开全部支持2113向量机SVM(SupportVectorMachine)是有监督的分类预测模型，本篇文章5261使用机器学习库scikit-learn中的手写数字数4102据集介绍使用Python对SVM模型进行1653训练并对手写数字进行识别的过程。准备工作手写数字识别的原理是将数字的图片分割为8X8的灰度值矩阵，将这64个灰度值作为每个数字的训练集对模型进行训练。手写数字所对应的真实数字作
核函数：解锁支持向量机的强大能力从零开始学习人工智能大数据人工智能机器学习
在机器学习的世界中，支持向量机（SVM）是一种强大的分类算法，而核函数则是其背后的“魔法”，让SVM能够处理复杂的非线性问题。今天，我们就来深入探讨核函数的奥秘，看看它们是如何帮助SVM在高维空间中找到最佳决策边界的。一、核函数是什么？核函数本质上是一种计算两个向量在高维空间中内积的方法，但它避免了直接将数据映射到高维空间的复杂计算。通过核函数，我们可以巧妙地将原始数据从低维空间映射到高维空间，从
支持向量机（SVM）：解锁数据分类与回归的强大工具从零开始学习人工智能人工智能开源性能优化
在机器学习的世界中，支持向量机（SupportVectorMachine，简称SVM）一直以其强大的分类和回归能力而备受关注。本文将深入探讨SVM的核心功能，以及它如何在各种实际问题中发挥作用。一、SVM是什么？支持向量机是一种监督学习算法，主要用于分类和回归任务。它的核心思想是通过在特征空间中找到一个最优的分界面（超平面），将不同类别的数据点分隔开，或者拟合出一个回归函数来预测目标值。SVM的强
JVM 视角下的指针压缩技术实现 javajvm
1准备1.1FBIWARNING文章异常啰嗦且绕弯。1.2版本使用openjdk24为跟踪的源码。fork仓库：https://github.com/openjdk/jdk/2源码追踪2.1oopDesc在JVM中，Java对象的最高层级抽象是oopDesc。代码路径在hotspot/share/oops/oop.hpp中。classoopDesc{friendclassVMStructs;fri
双路物理CPU机器上安装Ubuntu并部署KVM以实现系统多开欧先生^_^ ubuntu linux 运维
在双路物理CPU机器上安装Ubuntu并部署KVM以实现系统多开，并追求性能最优，需要从硬件、宿主机系统、KVM配置、虚拟机配置等多个层面进行优化。以下是详细的操作指南和优化建议：阶段一：BIOS/UEFI设置优化(重启进入)启用虚拟化技术:IntelCPU:IntelVT-x(VirtualizationTechnology)AMDCPU:AMD-V(SVM-SecureVirtualMachi
【Python深度学习（第二版）（2）】深度学习之前：机器学习简史 roman_日积跬步-终至千里 #python深度学习（第二版）深度学习机器学习人工智能
文章目录一.深度学习的起源1.概率建模--机器学习分类器2.早期神经网络--反向传播算法的转折3.核方法--忽略神经网络4.决策树、随机森林和梯度提升机5.神经网络替代svm与决策树二.深度学习与机器学习有何不同可以这样说，当前工业界所使用的大部分机器学习算法不是深度学习算法。深度学习不一定总是解决问题的正确工具：有时没有足够的数据，深度学习不适用；有时用其他算法可以更好地解决问题。如果第一次接触
Python 学习日记 day15 heard_222532 Python 学习日记 python 学习机器学习
@浙大疏锦行CRWUBearingsSVM_Fault_Classificationimportnumpyasnpfromsklearn.datasetsimportmake_classificationfromsklearn.model_selectionimporttrain_test_splitfromsklearn.linear_modelimportLogisticRegressionf
支持向量机（SVM）例题 phoenix@Capricornus PR书稿支持向量机算法机器学习
对于图中所示的线性可分的20个样本数据，利用支持向量机进行预测分类，有三个支持向量A(0,2)A(0,2)A(0,2)、B(2,0)B(2,0)B(2,0)和C(−1,−1)C(-1,-1)C(−1,−1)。求支持向量机的线性判别函数。删除点A后，支持向量是否变化?求解：三个点，建立联立方程组：{w1xA+w2yA+b=1w1xB+w2yB+b=1w1xC+w2yC+b=−1\begin{case
支持向量机SVM：从数学原理到实际应用代码很孬写支持向量机算法机器学习语言模型自然语言处理 ai 人工智能
前言本篇文章全面深入地探讨了支持向量机（SVM）的各个方面，从基本概念、数学背景到Python和PyTorch的代码实现。文章还涵盖了SVM在文本分类、图像识别、生物信息学、金融预测等多个实际应用场景中的用法。一、引言背景支持向量机（SVM,SupportVectorMachines）是一种广泛应用于分类、回归、甚至是异常检测的监督学习算法。自从Vapnik和Chervonenkis在1995年首
计算机视觉（图像算法工程师）学习路线陳錄生计算机视觉学习人工智能
计算机视觉学习路线Python基础常量与变量列表、元组、字典、集合运算符循环条件控制语句函数面向对象与类包与模块Numpy+Pandas+Matplotlibnumpy机器学习回归问题线性回归Lasso回归Ridge回归多项式回归决策树回归AdaBoostGBDT随机森林回归分类问题逻辑回归决策树ID3-信息增益C4.5-信息增益率随机森林SVMNaiveBayes聚类问题K-MeansMDSCA
基于C++实现的深度学习(cnn/svm)分类器Demo 长长同学深度学习 c++cnn
1.项目简介本项目是一个基于C++实现的深度学习与传统机器学习结合的分类器Demo，主要流程为：从CSV文件读取样本数据用卷积神经网络（CNN）进行特征提取用支持向量机（SVM）进行最终分类支持模型的保存与加载提供DLL接口，方便与其他软件集成网盘地址:https://pan.baidu.com/s/1VoFdPAzueITcl_Up6hR_Wg2.主要结构与全局变量Sample结构体：存储单个样
python打卡DAY25 Bugabooo python 开发语言
##注入所需库importpandasaspdimportseabornassnsimportmatplotlib.pyplotaspltimportrandomimportnumpyasnpimporttimeimportshap#fromsklearn.svmimportSVC#支持向量机分类器##fromsklearn.neighborsimportKNeighborsClassifier#
python打卡DAY20 Bugabooo python 开发语言
##注入所需库importpandasaspdimportseabornassnsimportmatplotlib.pyplotaspltimportrandomimportnumpyasnpimporttimeimportshapfromsklearn.svmimportSVC#支持向量机分类器#fromsklearn.neighborsimportKNeighborsClassifier#K近
python 打卡DAY27 Bugabooo python 开发语言
##注入所需库importpandasaspdimportseabornassnsimportmatplotlib.pyplotaspltimportrandomimportnumpyasnpimporttimeimportshap#fromsklearn.svmimportSVC#支持向量机分类器##fromsklearn.neighborsimportKNeighborsClassifier#
java代码生成简写优秀135 java
1.psvm2.sout注意：idea无法快捷键输出System.out.println();并且即使手动输入也会报错cannotresolvesymbol“println”，原因是没写main函数。。。3.数组名.sout或者变量名.sout4.数组名.fori或者数字.fori（普通for）5.单列集合名.for(增强for)
计算机视觉与深度学习｜ Matlab实现INFO-BiTCN-SVM向量加权优化算法优化双向时间卷积神经网络结合支持向量机时间序列预测，含优化前后对比（Matlab完整源码和数据）单北斗SLAMer cnn lstm matlab 深度学习机器学习
以下是一个基于Matlab2023b实现的INFO-BiTCN-SVM时间序列预测系统的完整代码框架，包含智能优化算法、双向时间卷积网络与支持向量机的混合模型以及多指标评估体系。代码经过模块化设计，可直接运行并复现实验结果。%%主程序：INFO-BiTCN-SVM时间序列预测系统clc;clear;closeall;warningoff;%设置随机种子保证可重复性rng(2024);%加载/生成仿
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。

SVM训练结果参数说明 训练参数说明 归一化加快速度和提升准确率 归一化还原

原文：http://blog.sina.com.cn/s/blog_57a1cae80101bit5.html

举例说明

你可能感兴趣的:(SVM)

SVM训练结果参数说明训练参数说明归一化加快速度和提升准确率归一化还原