q123456789098

opencv使用svm

作者群号 C语言交流中心 240137450 微信 15013593099

OpenCV开发SVM算法是基于LibSVM软件包开发的，LibSVM是台湾大学林智仁(LinChih-Jen)等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包。用OpenCV使用SVM算法的大概流程是

1）设置训练样本集

需要两组数据，一组是数据的类别，一组是数据的向量信息。

2）设置SVM参数

利用CvSVMParams类实现类内的成员变量svm_type表示SVM类型：

CvSVM：：C_SVC C-SVC

CvSVM：：NU_SVC v-SVC

CvSVM：：ONE_CLASS 一类SVM

CvSVM：：EPS_SVR e-SVR

CvSVM：：NU_SVR v-SVR

成员变量kernel_type表示核函数的类型：

CvSVM：：LINEAR 线性：u‘v

CvSVM：：POLY 多项式：(r*u'v +coef0)^degree

CvSVM：：RBF RBF函数：exp(-r|u-v|^2)

CvSVM：：SIGMOID sigmoid函数：tanh(r*u'v +coef0)

成员变量degree针对多项式核函数degree的设置，gamma针对多项式/rbf/sigmoid核函数的设置，coef0针对多项式/sigmoid核函数的设置，Cvalue为损失函数，在C-SVC、e-SVR、v-SVR中有效，nu设置v-SVC、一类SVM和v-SVR参数，p为设置e-SVR中损失函数的值，class_weightsC_SVC的权重，term_crit为SVM训练过程的终止条件。其中默认值degree= 0，gamma = 1，coef0 = 0，Cvalue = 1，nu = 0，p = 0，class_weights =0

3）训练SVM

调用CvSVM：：train函数建立SVM模型，第一个参数为训练数据，第二个参数为分类结果，最后一个参数即CvSVMParams

4）用这个SVM进行分类

调用函数CvSVM：：predict实现分类

5）获得支持向量

除了分类，也可以得到SVM的支持向量，调用函数CvSVM：：get_support_vector_count获得支持向量的个数，CvSVM：：get_support_vector获得对应的索引编号的支持向量。

实现代码如下：

[cpp] view plain copy

// step 1:
float labels[4] = {1.0, -1.0, -1.0, -1.0};
Mat labelsMat(3, 1, CV_32FC1, labels);
float trainingData[4][2] = { {501, 10}, {255, 10}, {501, 255}, {10, 501} };
Mat trainingDataMat(3, 2, CV_32FC1, trainingData);
// step 2:
CvSVMParams params;
params.svm_type = CvSVM::C_SVC;
params.kernel_type = CvSVM::LINEAR;
params.term_crit = cvTermCriteria(CV_TERMCRIT_ITER, 100, 1e-6);
// step 3:
CvSVM SVM;
SVM.train(trainingDataMat, labelsMat, Mat(), Mat(), params);
// step 4:
Vec3b green(0, 255, 0), blue(255, 0, 0);
for (int i=0; i
{
for (int j=0; j
{
Mat sampleMat = (Mat_<float>(1,2) << i,j);
float response = SVM.predict(sampleMat);
if (fabs(response-1.0) < 0.0001)
{
image.at(j, i) = green;
}
else if (fabs(response+1.0) < 0.001)
{
image.at(j, i) = blue;
}
}
}
// step 5:
int c = SVM.get_support_vector_count();
for (int i=0; i
{
const float* v = SVM.get_support_vector(i);
}

总结：

1、SVM是一个分类器(Classifier) ，也可以做回归 (Regression) 。

2、 SVM的主要思想可以概括为两点 ：

(1)它是针对线性可分情况进行分析，对于线性不可分的情况，通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分，从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能；

(2)它基于结构风险最小化理论之上在特征空间中建构最优分割超平面，使得学习器得到全局最优化，并且在整个样本空间的期望风险以某个概率满足一定上界。

3、 最优超平面 ：使得每一类数据与超平面距离最近的向量与超平面之间的距离最大的这样的平面。

4、 支持向量 ：那些在间隔区边缘的训练样本点。

5、 核函数 ：SVM的关键在于核函数。简单说就是将低维空间线性不可分的样本转化为高维空间线性可分的。低维空间向量集通常难于划分，解决的方法是将它们映射到高维空间。但这个办法带来的困难就是计算复杂度的增加，而核函数正好巧妙地解决了这个问题。也就是说，只要选用适当的核函数，就可以得到高维空间的分类函数。在SVM理论中，采用不同的核函数将导致不同的SVM算法。在确定了核函数之后，由于确定核函数的已知数据也存在一定的误差，考虑到推广性问题，因此引入了松弛系数 以及 惩罚系数 两个参变量来加以校正。在确定了核函数基础上，再经过大量对比实验等将这两个系数取定，该项研究就基本完成，适合相关学科或业务内应用，且有一定能力的推广性。当然误差是绝对的，不同学科、不同专业的要求不一。

常用的核函数有以下4种：

⑴ 线性核函数

⑵ 多项式核函数

⑶ 径向基(RBF)核函数(高斯核函数)

⑷ Sigmoid 核函数(二层神经网络核函数)

<5-1> 径向基(RBF)核函数(高斯核函数) 的说明

这个核函数可以将原始空间映射到无穷维空间。对于参数，如果选的很大，高次特征上的权重实际上衰减得非常快，所以实际上（数值上近似一下）相当于一个低维的子空间；反过来，如果选得很小，则可以将任意的数据映射为线性可分——当然，这并不一定是好事，因为随之而来的可能是非常严重的过拟合问题。不过，总的来说，通过调控参数，高斯核实际上具有相当高的灵活性，也是使用最广泛的核函数 之一。

<5-2> 径向基(RBF)核函数的参数选取

径向基（ RBF ）核函数主要确定 惩罚因子 C 和参数。其中C 控制着使间隔margin 最大且错误率最小的折中，就是在确定的特征空间中调节学习机器的置信范围和经验风险的比例；而是RBF 核函数参数，主要影响样本数据在高维特征空间中分布的复杂程度。因此分类器的好坏取决于参数C 、的确定。参数选择的好坏直接影响到分类器性能的好坏，但这方面目前缺乏理论指导，没有合适的方法，传统的参数选取都是通过反复的试验，人工选取令人满意的解。这种方法需要人的经验指导，并且需要付出较高的时间代价。常用的参数选择方法有：

I、网格法【OpenCV中SVM用到】

选取 U 个 C 和 V 个，就会有的组合状态，每种组合状态对应一种SVM 分类器，通过测试对比，找出推广识别率最高的 C 和组合。一般取U=V=15 ，C 取值分别为，取值分别为共255 个 C 、组合。网格法实质上是一种穷举法，随着排列组合的可能情况越多，其运算量将急剧增加。

II、双线性法

利用 RBF 核 SVM 的性能，首先对线性 SVM 求解最佳参数，使之为参数的线性 SVM 推广识别率最高，称为；然后固定，对满足

的，训练SVM ，根据对其推广识别率的估算，得到最优参数。虽然这种方法对有非常明确的公式，但首先要求解C ，而很难确定最优的C 。

III、梯度下降搜索法

设泛化误差为

核函数为，是待定的核参数，基本过程为：

a 将置一个初始值

b 用一个标准的 SVM 解法（如 SMO ），求出 SVM 的解—— Lagrange 乘子

c

d 跳转到 b 直至 T 最小

其中是足够小且最终收敛到零的数列。步骤c 是一个标准的梯度下降算法。由分类函数公式可以求解，的求解较麻烦，需要通过求解一个二次规划问题得到。

IV、遗传算法

基本步骤为：

a t=0

b 随机选择初始种群 P(t)

c 计算个体适应度函数值 F(t)

d 若种群中最优个体所对应的适应度函数值足够大或者算法已经连续运行多代，且个体的最佳适应度无明显改进则转到第h 步

e t=t+1

f 应用选择算子法从 P(t-1) 中选择P(t)

g 对 P(t) 进行交叉、变异操作，转到第c 步

h 给出最佳的核函数参合和惩罚因子 C ，并用其训练数据集以获得全局最优分类面。

遗传算法的缺点是收敛很慢，容易受局部极小值干扰。

<5-3>验证核函数性能的方法(3种)(衡量泛化能力)

I、单一验证估计

将大数量的样本分为两部分：训练样本和测试样本，此时测试集的错误率为：

式中， p 为样本数，为样本实际所属的类别，为对训练样本预测出的类别。这种方法直观简单。可以通过理论证明，当样本数量趋近于无穷大时，该估计为无偏估计，但现实中处理的总是数量有限的样本问题，所以此方法的应用范围在一定程度上受到了限制。

II、K 折交叉验证【OpenCV中SVM用到】

K 折交叉验证是一种迭代方式，一共迭代 K 次，每次将所有训练样本分为K 份相等的子集样本，训练样本是选择其中K-1 份样本，测试样本是剩余的一个样本。通过K 次迭代后，可以利用平均值来评估期望泛化误差，根据期望泛化误差选择一组性能最佳的参数。K 折交叉验证由 K 折交叉验证误差决定， K 折交叉验证误差是算法错误率的估计，其计算方式为：假设为错分类的样本个数，经过K 次迭代后，得到，那么算法的错误率可以近似为错误分类数和总样本点数之比。该方法具有操作简单的优点，成为目前应用最广泛 的方法，但是这种方法容易受样本划分方式的影响。

III、留一法

留一法是 K 折交叉验证的特例，其基本思想是当可用样本数为N 时，训练集由其中N-1 个样本构成，测试样本为剩余的一个样本，经N 次重复，使所有的样本都参加过测试。通过理论证明，这种估计是无偏估计。因此，从实现原理来说，留一法的效果是最佳的；但是，在参数固定的情况下，确定其错误率对样本要训练N-1 次，运算量很大。为了解决留一法计算量大的缺陷，目前该方法确定核函数及其参数的常用方法是估计经验风险的上界，只要上界小，分类器的推广能力就强。

二、OpenCV中SVM的参数和函数说明

1、训练参数结构体 CvSVMParams (可参考【OpenCV2.4】SVM的参数和函数介绍 )

(1)注意： 该结构必须被初始化后，传给CvSVM

(2)构造函数的原型：

C++: CvSVMParams:: CvSVMParams ()

C++: CvSVMParams:: CvSVMParams (int svm_type ,

int kernel_type ,

double degree ,

double gamma ,

double coef0 ,

double Cvalue ,

double nu ,

double p ,

CvMat* class_weights ,

CvTermCriteria term_crit

)

(3)注释

A. 默认的构造函数初始化有以下值：

CvSVMParams::CvSVMParams() : svm_type(CvSVM::C_SVC), kernel_type(CvSVM::RBF), degree(0),
    gamma(1), coef0(0), C(1), nu(0), p(0), class_weights(0)
{
    term_crit = cvTermCriteria( CV_TERMCRIT_ITER+CV_TERMCRIT_EPS, 1000, FLT_EPSILON );
}

B. 构造函数的参数(一共10个)：

<1> svm_type: 指定SVM的类型(5种)：

CvSVM::C_SVC : C类支持向量分类机。 n类分组 (n 2)，允许用异常值惩罚因子C进行不完全分类。
CvSVM::NU_SVC : 类支持向量分类机。n类似然不完全分类的分类器。参数为取代C（其值在区间【0，1】中，nu越大，决策边界越平滑）。
CvSVM::ONE_CLASS : 单分类器，所有的训练数据提取自同一个类里，然后SVM建立了一个分界线以分割该类在特征空间中所占区域和其它类在特征空间中所占区域。
CvSVM::EPS_SVR : 类支持向量回归机。训练集中的特征向量和拟合出来的超平面的距离需要小于p。异常值惩罚因子C被采用。
CvSVM::NU_SVR : 类支持向量回归机。代替了 p。

<2> kernel_type: SVM的内核类型(4种)：

CvSVM::LINEAR : 线性内核，没有任何向映射至高维空间，线性区分（或回归）在原始特征空间中被完成，这是最快的选择。

CvSVM::POLY : 多项式内核：

CvSVM::RBF : 基于径向的函数，对于大多数情况都是一个较好的选择：

CvSVM::SIGMOID : Sigmoid函数内核：

<3> degree: 内核函数（POLY）的参数degree。

<4> gamma: 内核函数（POLY/ RBF/ SIGMOID）的参数。

<5> coef0: 内核函数（POLY/ SIGMOID）的参数coef0。

<6> Cvalue: SVM类型（C_SVC/ EPS_SVR/ NU_SVR）的参数C。

<7> nu: SVM类型（NU_SVC/ ONE_CLASS/ NU_SVR）的参数。

<8> p: SVM类型（EPS_SVR）的参数。

<9> class_weights: C_SVC中的可选权重，赋给指定的类，乘以C以后变成。所以这些权重影响不同类别的错误分类惩罚项。权重越大，某一类别的误分类数据的惩罚项就越大。

<10> term_crit: SVM的迭代训练过程的中止条件，解决部分受约束二次最优问题。您可以指定的公差和/或最大迭代次数。

2、支持向量机 CvSVM 类(8个函数)

(1)构造函数

<1>构造函数的原型

C++: CvSVM:: CvSVM ()

C++: CvSVM:: CvSVM (const Mat& trainData ,

const Mat& responses ,

const Mat& varIdx=Mat() ,

const Mat& sampleIdx=Mat() ,

CvSVMParams params=CvSVMParams()

)

C++: CvSVM:: CvSVM (const CvMat* trainData ,

const CvMat* responses ,

const CvMat* varIdx=0 ,

const CvMat* sampleIdx=0 ,

CvSVMParams params=CvSVMParams()

)

<2>构造函数的参数注释(5个)

trainData : 训练数据，必须是CV_32FC1 （32位浮点类型，单通道）。数据必须是CV_ROW_SAMPLE的，即特征向量以行来存储。
responses : 响应数据，通常是1D向量存储在CV_32SC1 （仅仅用在分类问题上）或者CV_32FC1格式。
varIdx : 指定感兴趣的特征。可以是整数(32sC1)向量，例如以0为开始的索引，或者8位(8uC1)的使用的特征或者样本的掩码。用户也可以传入NULL指针，用来表示训练中使用所有变量／样本。
sampleIdx : 指定感兴趣的样本。描述同上。
params : SVM参数。

(2)训练函数

<1>作用：训练一个SVM

<2>训练函数的原型

C++: bool CvSVM:: train (const Mat& trainData ,

const Mat& responses ,

const Mat& varIdx=Mat() ,

const Mat& sampleIdx=Mat() ,

CvSVMParams params=CvSVMParams()

)

C++: bool CvSVM:: train (const CvMat* trainData ,

const CvMat* responses ,

const CvMat* varIdx=0 ,

const CvMat* sampleIdx=0 ,

CvSVMParams params=CvSVMParams()

)

<3>训练函数的参数注释(5个)

和构造函数的参数是一样的，请参考构造函数的参数注释。

(3)自动训练函数

<1>作用： 根据可选参数训练一个SVM。

<2>自动训练函数原型

C++: bool CvSVM:: train_auto (const Mat & trainData ,

const Mat & responses ,

const Mat & varIdx ,

const Mat & sampleIdx ,

CvSVMParams params ,

int k_fold=10 ,

CvParamGrid Cgrid=CvSVM::get_default_grid(CvSVM::C) ,

CvParamGrid gammaGrid=CvSVM::get_default_grid(CvSVM::GAMMA) ,

CvParamGrid pGrid=CvSVM::get_default_grid(CvSVM::P) ,

CvParamGrid nuGrid=CvSVM::get_default_grid(CvSVM::NU) ,

CvParamGrid coeffGrid=CvSVM::get_default_grid(CvSVM::COEF) ,

CvParamGrid degreeGrid=CvSVM::get_default_grid(CvSVM::DEGREE) ,

bool balanced=false

)

C++: bool CvSVM:: train_auto (const CvMat * trainData ,

const CvMat * responses ,

const CvMat * varIdx ,

const CvMat * sampleIdx ,

CvSVMParams params ,

int kfold=10 ,

CvParamGrid Cgrid=get_default_grid(CvSVM::C) ,

CvParamGrid gammaGrid=get_default_grid(CvSVM::GAMMA) ,

CvParamGrid pGrid=get_default_grid(CvSVM::P) ,

CvParamGrid nuGrid=get_default_grid(CvSVM::NU) ,

CvParamGrid coeffGrid=get_default_grid(CvSVM::COEF) ,

CvParamGrid degreeGrid=get_default_grid(CvSVM::DEGREE) ,

bool balanced=false

)

<3>自动训练函数的参数注释(13个)

前5个参数参考构造函数的参数注释。
k_fold: 交叉验证参数。训练集被分成k_fold的自子集。其中一个子集是用来测试模型，其他子集则成为训练集。所以，SVM算法复杂度是执行k_fold的次数。
*Grid: (6个) 对应的SVM迭代网格参数。
balanced: 如果是true则这是一个2类分类问题。这将会创建更多的平衡交叉验证子集。

<4>自动训练函数的使用说明

这个方法根据CvSVMParams中的最佳参数C, gamma, p, nu, coef0, degree自动训练SVM模型。
参数被认为是最佳的交叉验证，其测试集预估错误最小。
如果没有需要优化的参数，相应的网格步骤应该被设置为小于或等于1的值。例如，为了避免gamma的优化，设置gamma_grid.step = 0，gamma_grid.min_val， gamma_grid.max_val 为任意数值。所以params.gamma 由gamma得出。
最后，如果参数优化是必需的，但是相应的网格却不确定，你可能需要调用函数CvSVM::get_default_grid()，创建一个网格。例如，对于gamma，调用CvSVM::get_default_grid(CvSVM::GAMMA)。
该函数为分类运行 (params.svm_type=CvSVM::C_SVC 或者 params.svm_type=CvSVM::NU_SVC) 和为回归运行 (params.svm_type=CvSVM::EPS_SVR 或者 params.svm_type=CvSVM::NU_SVR)效果一样好。如果params.svm_type=CvSVM::ONE_CLASS，没有优化，并指定执行一般的SVM。

<5>网格搜索法+K交叉验证

上述使用说明是OpenCV使用文档中的，这里再加其他一些补充：

A、可参考文章《 SVM分类核函数和参数选择比较》《基于改进的网格搜索法的SVM参数优化》《LibSVM分类的实用指南》《 libsvm交叉验证与网格搜索（参数选择）》，讲到了K交叉验证和网格搜索法。

B、优化参数的方式一般是用网格搜索法取值，然后对这组参数进行K交叉验证，计算精确值(交叉验证的准确率等于能够被正确分类的数量百分比)，寻求最优参数。

(4)预测函数

<1>作用 ：对输入样本做预测响应。

<2>预测函数的函数原型

C++: float CvSVM:: predict (const Mat& sample , bool returnDFVal=false ) const

C++: float CvSVM:: predict (const CvMat* sample , bool returnDFVal=false ) const

C++: float CvSVM:: predict (const CvMat* samples , CvMat* results ) const

<3>预测函数的参数注释

sample: 需要预测的输入样本。
samples: 需要预测的输入样本们。
returnDFVal: 指定返回值类型。如果值是true，则是一个2类分类问题，该方法返回的决策函数值是边缘的符号距离。
results: 相应的样本输出预测的响应。

<4>预测函数的使用说明

这个函数用来预测一个新样本的响应数据(response)。
在分类问题中，这个函数返回类别编号；在回归问题中，返回函数值。
输入的样本必须与传给trainData的训练样本同样大小。
如果训练中使用了varIdx参数，一定记住在predict函数中使用跟训练特征一致的特征。
后缀const是说预测不会影响模型的内部状态，所以这个函数可以很安全地从不同的线程调用。

(5)生成SVM网格参数的函数

<1>作用 ：生成一个SVM网格参数。

<2>函数原型

C++: CvParamGrid CvSVM:: get_default_grid (int param_id )

<3>函数的参数注释

param_id: SVM参数的IDs必须是下列中的一个：(网格参数将根据这个ID生成 )
- CvSVM::C
- CvSVM::GAMMA
- CvSVM::P
- CvSVM::NU
- CvSVM::COEF
- CvSVM::DEGREE

<4>函数的使用说明

该函数生成一个指定的SVM网格参数，主要用于传递给自动训练函数 CvSVM::train_auto()。

(6)获取当前SVM参数的函数

<1>作用：获取当前SVM参数

<2>函数原型：

C++: CvSVMParams CvSVM:: get_params() const

<3>函数的使用说明

这个函数主要是在使用CvSVM::train_auto()时去获得最佳参数。

(7)获取支持向量及其数量的函数

<1>作用 ：获取支持向量及其数量

<2>函数原型 ：

C++: int CvSVM:: get_support_vector_count () const //获取支持向量的数量

C++: const float* CvSVM:: get_support_vector (int i ) const //获取支持向量

参数： i – 指定支持向量的索引。

(8)获取所用特征的数量的函数

<1>作用 ：获取所用特征的数量

<2>函数原型：

C++: int CvSVM:: get_var_count () const

三、OpenCV的简单的程序例子

1、 Introduction to Support Vector Machines (可参考【OpenCV2.4】SVM的参数和函数介绍 )

上述讲述了处理一个 线性可分情况 的例子，包含了SVM使用的几个步骤：

(1)准备训练样本及其类别标签( trainingDataMat，labelsMat )

(2)设置训练参数(CvSVMParams)

(3)对SVM进行训练( CvSVM:: train)

(4)对新的输入样本进行预测( CvSVM:: predict)

(5)获取支持向量( CvSVM:: get_support_vector_count ，CvSVM::get_support_vector )

2、 Support Vector Machines for Non-Linearly Separable Data (可参考【OpenCV2.4】SVM处理线性不可分的例子 )

上述讲述了处理一个 线性不可分情况 的例子，着重讲述了 惩罚因子C 的作用：

C比较大时：分类错误率较小，但是间隔也较小。在这种情形下，错分类对模型函数产生较大的影响，既然优化的目的是为了最小化这个模型函数，那么错分类的情形必然会受到抑制。
C比较小时：间隔较大，但是分类错误率也较大。在这种情形下，模型函数中错分类之和这一项对优化过程的影响变小，优化过程将更加关注于寻找到一个能产生较大间隔的超平面。

换而言之，C越大，优化时越关注错分问题；C越小，越关注能否产生一个较大间隔的超平面。

由于样本非线性可分，自然就有一些被错分类的样本。

3、多分类的简单例子 (可参考利用SVM解决2维空间向量的3级分类问题 )

上述讲述了一个三分类的例子，核函数用了RBF，并用到了其参数gamma，以及惩罚因子C，训练与预测和二分类一样，只要对样本赋予第三类的类别标签。

4、文字识别的简单例子 (可参考 SVM对文字识别的简单使用和使用OPENCV训练手写数字识别分类器 )

训练与预测的使用方法和上述一样，主要看下对图像数据的处理(简单的特征提取)。

5、HOG+SVM的例子 (可参考 OpenCV中的HOG+SVM物体分类和利用HOG+SVM训练自己的XML文件 )

训练与预测的使用方法还是和上述一样，主要看下Hog特征的使用( HOGDescriptor::compute )。

四、SVM处理流程总结：

1、收集数据 ， 相关性分析 （比如p卡方检验）， 特征选择 （比如主成份分析PCA）。

2、归一化数据 ：就是根据实际要求，将数据的取值范围转化为统一的区间如[a,b],a,b为整数。（参考缩放训练和测试数据时的常见错误 [附录B]）

3、分训练集和测试集 ：利用抽样技术将数据集分为训练集和测试集。抽样技术有分层抽样，简单抽样（等概率抽样）。 一般训练集数量大于测试集数量 ，就是要保证足够的训练样例。

4、将数据转化为软件（接口）所支持的格式 。

5、选择核函数 ，可以优先考虑RBF。

6、使用交叉验证（cross-validation）寻找最佳参数C和Υ： 对训练集利用交叉验证法选择最好的参数C和r（西格玛）（RBF核函数中的参数gama）。可以通过网格法寻找出最优的参数，注意一次交叉验证得到一个参数对所对应的模型精度，网格法目的就是找到使得模型精度达到对高的参数对（这里的参数对可能不止两个，有可能也有其他的），可以使用一些启发式的搜索来降低复杂度，虽然这个方法笨了点，但是它能得到很稳定的搜索结果。需要提到的这里在对训练集进行分割的时候涉及到抽样，一个较好的方法就是分层抽样。从这步可以看出其实 Cross－Validation是一种评估算法的方法。

a. 训练的目的得到参数和支持向量（存储在xml文件中），得到参数就能得到支持向量，带进算式计算SVM分类的准确度，以准确度最高的一组参数作为最终的结果，没有绝对线性可分的，都有一个误差，参数就是把那个误差降到最低。

b. 这里的准确性是指将训练集的每个样本的向量与支持向量做运算，将运算结果与标记值比较,判断是否属于这个类，统计这个类的正确的样本数，最高的那一组参数准确性最高。

c. 最终训练得到分类器。SVM只能分两类，所以这里的分类器是两个类组成一个分类器，如果有K类，就有k(k-1)/2个分类器。

7、使用最佳参数C和Υ来训练整个训练集： 用6中得到的参数对在整个训练集合上进行训练，从而得出模型。

8、测试： 利用测试集测试模型，得到精度。这个精度可以认为是模型最终的精度。当然有人会担心3步中抽样会有一定的误差，导致8得到的精度不一定是最好的，因此可以重复3－8得到多个模型的精度，然后选择最好的一个精度最为模型的精度（或者求所有精度的均值做为模型精度）。（需要多次选择训练集和测试集，然后每一次得到一个精度的模型，选择最好的一个精度作为模型，也就是我们项目里面要多次训练的原因）。

9. 识别分类： 两个类超平面的形成，意味着目标函数的形成，然后代入待识别样本，识别时对应的组代入对应的参数，得出结果进行投票，判定属于那个类。

SVM样本训练步骤

1、引言

近期在做飞形体目标识别的研究，需要做SVM训练来生成识别的分类器。从网上找了大量的参考文章，但是发现很多文章都讲的比较零散。鉴于此原因，本文对SVM训练过程做一个较为系统的总结，希望对广大初学者有所帮助。

2、步骤

（1）生成SVM描述文件；

将需要训练的样本文件的路径和对应的分类类别号写入txt文档，如：

plane/飞机训练正样本Normalize/0.jpg
1
plane/飞机训练正样本Normalize/1.jpg            命名为：SVM_DATA.txt
1

（2）将描述文件读入容器中；

定义两个容器，用于保存样本路径和分类标号，如：

 vector img_path;  
         vector img_catg;  

读入数据：

         int nLine = 0;  
   string buf;  
   ifstream svm_data( "SVM_DATA.txt" ); 

while( svm_data )  
        {    

                if( getline( svm_data, buf) )   
            /*原型 
    　　istream& getline ( istream &is , string &str , char delim ); 　　istream& getline ( istream& , string& ); 
    参数  is 进行读入操作的输入流 　　str 存储读入的内容 　　delim 终结符    返回值 与参数is是一样的 
    功能  将输入流is中读到的字符存入str中，直到遇到终结符delim才结束。 
      对于第一个函数delim是可以由用户自己定义的终结符；对于第二个函数delim默认为 '\n'（换行符）。 　　 
      函数在输入流is中遇到文件结束符（EOF）或者在读入字符的过程中遇到错误都会结束。 　　 
      在遇到终结符delim后，delim会被丢弃，不存入str中。在下次读入操作时，将在delim的下个字符开始读入。*/   
                {    
                nLine ++;    
                if( nLine % 2 == 0 )    
                    {    
                         img_catg.push_back( atoi( buf.c_str() ) );//atoi将字符串转换成整型，值为0或1  用0,1区分正负样本  
                         //功 能： 把字符串转换成整型数。 　　名字来源：array to integer 的缩写。 　　  
                         //原型： int atoi(const char *nptr); 　　  
    //函数说明: 参数nptr字符串，如果第一个非空格字符不存在或者不是数字也不是正负号则返回零，否则开始做类型转换，  
    //之后检测到非数字(包括结束符 \0) 字符时停止转换，返回整型数。   
                        // 函数声明：const char *c_str(); 　　c_str()函数返回一个指向正规C字符串的指针, 内容与本string串相同.   
                }    
                else    
                    {    
                    img_path.push_back( buf );//图像路径     
                    }    
                }    
            }    
            svm_data.close();//关闭文件

（3）读入样本数量，生成样本矩阵和类型矩阵

    CvMat *data_mat, *res_mat;    
            int nImgNum = nLine / 2;            //读入样本数量     
        样本矩阵，nImgNum：横坐标是样本数量， WIDTH * HEIGHT：样本特征向量，即图像大小     
            data_mat = cvCreateMat( nImgNum, 144, CV_32FC1 );    
            cvSetZero( data_mat );    
            //类型矩阵,存储每个样本的类型标志     
            res_mat = cvCreateMat( nImgNum, 1, CV_32FC1 );    
            cvSetZero( res_mat );

（4）读入样本图像

    IplImage* src;    
        IplImage* trainImg=cvCreateImage(cvSize(64,64),8,3);//需要分析的图片  
          
       
        for( string::size_type z = 0; z != img_path.size(); z++ )    //整体循环为z  
        {    
               src=cvLoadImage(img_path[z].c_str(),1);   
            // 函数声明：const char *c_str();c_str()函数返回一个指向正规C字符串的指针, 内容与本string串相同.    
                if( src == NULL )    
                {    
                    cout<<" can not load the image: "<

 
  （5）提取HOG特征 
   
   
        //以下为提取Hog特征  
                   cvResize(src,trainImg);   //读取图片，归一化大小        
                   HOGDescriptor *hog=new HOGDescriptor(cvSize(64,64),cvSize(16,16),cvSize(16,16),cvSize(16,16),9);    
      
                    vectordescriptors;//结果数组        
                    hog->compute(trainImg, descriptors,Size(8,8), Size(0,0)); //调用计算函数开始计算        
                    cout<<"HOG dims: "<::iterator iter=descriptors.begin();iter!=descriptors.end();iter++)    //迭代器  
                    {    
                    cvmSet(data_mat,z,n,*iter);   //将HOG特征 存入data_mat矩阵中  
    x=cvmGet(data_mat,z,n);  
    cout<<"hog"<
 
   
 
   
 
  
 
  （6）将HOG特征写入txt文件 
   
    
    
        FILE *fp1;  
        int i,j;  
        if((fp1=fopen("Hog.txt","ab"))==NULL)// 读写打开一个二进制文件，允许读或在文件末追加数据。  
        {  
            printf("can not open the hu file\n");  
            exit(0);//正常退出程序  
        }  
        for (i = 0; i <144; ++i)   
        {  
            fprintf(fp1,"%lf ",descriptors[i]);   
        }  
            //fprintf(fp1,"\r\n");  
        fclose(fp1);  
      
                    cvmSet( res_mat, z, 0, img_catg[z] );   //将正负样本标记存入矩阵res_mat中  
                    cout<<" end processing "<
 
    
 
    
 
   
 
   （7）进行SVM训练 
  
 
      CvSVM svm = CvSVM();      
        CvSVMParams param;      
        CvTermCriteria criteria;      
           criteria = cvTermCriteria( CV_TERMCRIT_EPS, 1000, FLT_EPSILON );      
        param = CvSVMParams( CvSVM::C_SVC, CvSVM::RBF, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria );      
    /*     
        SVM种类：CvSVM::C_SVC     
        Kernel的种类：CvSVM::RBF     
        degree：10.0（此次不使用）     
        gamma：8.0     
       coef0：1.0（此次不使用）     
        C：10.0     
        nu：0.5（此次不使用）     
       p：0.1（此次不使用）     
       然后对训练数据正规化处理，并放在CvMat型的数组里。     
                                                            */         
        //SVM学习          
        svm.train( data_mat, res_mat, NULL, NULL, param );      
        //利用训练数据和确定的学习参数,进行SVM学习        
        svm.save( "SVM_DATA1.xml" );     
      
        cvReleaseImage(&src);  
        cvReleaseMat( &data_mat );   
        cvReleaseMat( &res_mat );    
         return 0;   
  
 
  
 
  在以上训练过程中，要特别注意的是在创建样本矩阵的时候，其矩阵大小由样本数量和样本提取的特征维数决定的。比如上面创建的样本矩阵大小为： 
   
    
    
 
     
    
   
   
  int nImgNum = nLine / 2; 行，144列；  144是由提取HOG特征时，由窗口大小、块大小、胞元大小和每个抱怨大小中的特征数共同决定的。 
  BOW特征提取函数（特征点篇） 
   
  简单的通过特征点分类的方法：                                                                       
  一、train 
   
   
   
   1.提取+/- sample的feature，每幅图提取出的sift特征个数不定（假设每个feature有128维） 
   2.利用聚类方法（e.g K-means）将不定数量的feature聚类为固定数量的(比如10个)words即BOW（bag of word） 
   （本篇文章主要完成以上的工作！） 
   3.normalize，并作这10个类的直方图e.g [0.1，0.2，0.7，0...0]; 
   4.将each image的这10个word作为feature_instance 和 (手工标记的) label（+/-）进入SVM训练 
   
  二、predict 
   
   
   1. 提取test_img的feature（如137个） 
   2. 分别求each feature与10个类的距离(e.g. 128维欧氏距离)，确定该feature属于哪个类 
  3. normalize，并作这10个类的直方图e.g [0，0.2，0.2，0.6，0...0];
 
   4. 应用SVM_predict进行结果预测 
  1.特征点提取 
  Ptr FeatureDetector::create(const string& detectorType) 
   
    
    
 
    
 
     
      
      
         Ptr FeatureDetector::create(const string& detectorType)  
//  "FAST" – FastFeatureDetector   
//  "STAR" – StarFeatureDetector   
//  "SIFT" – SIFT (nonfree module)//必须使用 initModule_nonfree()初始化  
//  "SURF" – SURF (nonfree module)//同上;   
//  "ORB" – ORB   
//  "MSER" – MSER   
//  "GFTT" – GoodFeaturesToTrackDetector   
//  "HARRIS" – GoodFeaturesToTrackDetector with Harris detector enabled   
//  "Dense" – DenseFeatureDetector   
//  "SimpleBlob" – SimpleBlobDetector  
     
 
       2.特征描述符提取 
      
     Ptr DescriptorExtractor::create(const string& descriptorExtractorType) 
         //  Ptr DescriptorExtractor::create(const string& descriptorExtractorType)     
    //  "SIFT" – SIFT   
    //  "SURF" – SURF   
    //  "ORB" – ORB   
    //  "BRIEF" – BriefDescriptorExtractor  
       
     3.描述符匹配 
      
     Ptr descriptorMatcher = DescriptorMatcher::create(const string& descriptorMatcherType) 
      
       
         
           //  descriptorMatcherType – Descriptor matcher type.   
    //  Now the following matcher types are supported:   
    //      BruteForce (it uses L2 )   
    //      BruteForce-L1   
    //      BruteForce-Hamming   
    //      BruteForce-Hamming(2)   
    //      FlannBased   
        Ptr descriptorMatcher = DescriptorMatcher::create( "BruteForce" );  
       
 
       
      
       
     4.class BOWTrainer 
      
     class BOWKmeansTrainer::public BOWTrainer:Kmeans算法训练 
     BOWKMeansTrainer ::BOWKmeansTrainer(int clusterCount, const TermCriteria& termcrit=TermCriteria(), int attempts=3, int flags=KMEANS_PP_CENTERS) 
     parameter same as Kmeans 
     
 
     
 
     
    
   
  Bag of Word闲谈 
  
 
  Bag of Word， 顾名思义，即将某些Word打包，就像我们经常会把类似的物品装到一个柜子，或者即使是随意打包一些物品，也是为了我们能够方便的携带，在对大数据作处理的时候，为了能够方便的携带这些数据中的信息，与其一个一个的处理，还不如打包来的容易一点。 Bag of Word 因其理论简单，易懂，在vision界也得到了广泛的应用，有人将Bag of Word改成Bag of Visual Word来提出，充其量只是炒炒概念罢了，其基本的思想还是BOW(Bag of Word)。
Anyway, 简单谈一些关于Bag of Word的东西：
Bag of word实现步骤：
 
  step 1: 大数据聚类，找到适当的聚类中心点----Vocabulary。 
   
  std::string image_folder_path("C:\\img\\train\\");

bool ReadImageNames(std::vector& image_file_names, std::string folder, std::string list_file_name)
{
    using namespace std;
    ifstream label_file(folder + list_file_name);
    if (!label_file)
        return false;
    string fname;
    while (!label_file.eof())
    {
        label_file >> fname;
        if (fname.length() == 0)
            continue;
        image_file_names.push_back(folder + fname + ".jpg");
        label_file >> fname;
    }
    label_file.close();
    return true;
}

// resize to 256x256
void UnifyImageSize(cv::Mat& image)
{
    using namespace cv;
    Mat unified_image;
    int s = cv::min(image.rows, image.cols);
    float scale = 128.0 / s;
    Size size(image.cols  * scale, image.rows * scale);
    cv::resize(image, unified_image, size);
    cv::medianBlur(unified_image, unified_image, 3);
    image = unified_image;
}

int getVocabulary(string &image_folder_path, string &image_list_file)
{   
 
    if (image_folder_path.back() != '\\' || image_folder_path.back() != '/')
        image_folder_path += "\\";

    int minHessian = 400;
    //Ptr feature_detector(new SurfFeatureDetector(minHessian));
    Ptr feature_detector = Ptr(new PyramidAdaptedFeatureDetector(Ptr(new SurfFeatureDetector(minHessian))));
    //Ptr descriptor_extractor = DescriptorExtractor::create("GridFAST");
    Ptr descriptor_extractor(new OpponentColorDescriptorExtractor(Ptr(new SurfDescriptorExtractor(minHessian))));
    //Ptr descriptor_extractor(new SurfDescriptorExtractor());
    vector keypoints;
    Mat descriptors;
    Mat training_descriptors;
    int i;

    //cout << "------ build vocabulary -----" << endl;
    //cout << "reading " << image_list_file << " ..." << endl;
    vector image_file_names;
    if(!ReadImageNames(image_file_names, image_folder_path, image_list_file))
    {
        cerr << "cannot read image names" << endl;
        return -1;
    }

    Mat image;
    //cout << "extract descriptors ...         ";
    //#pragma omp parallel for schedule(dynamic) private(image, keypoints, descriptors)
    for (i = 0; i < image_file_names.size(); i++)
    {
        image = imread(image_file_names[i]);//, CV_LOAD_IMAGE_GRAYSCALE);
        UnifyImageSize(image);
        feature_detector->detect(image, keypoints);
        descriptor_extractor->compute(image, keypoints, descriptors);
        //#pragma omp critical
        {
            training_descriptors.push_back(descriptors);
            //cout << "\b\b\b\b\b\b\b\b\b";
            //cout << setfill(' ') << setw(4) << i << "/" << setw(4) << image_file_names.size();
        }
    }
    //cout << endl;

    //cout << "Total Descriptors: " << training_descriptors.rows << endl;
    //cout << "Saving training_descriptors.yml" << endl;

    FileStorage fs_descriptors("c:\\img\\train\\training_descriptors.yml", FileStorage::WRITE);
    fs_descriptors << "training_descriptors" << training_descriptors;
    fs_descriptors.release();

    BOWKMeansTrainer bowtrainer(2000); // 1000 clusters
    bowtrainer.add(training_descriptors);
    cout << "clustering BOW features ..." << endl;
    Mat vocabulary = bowtrainer.cluster();

    //cout << "Saving vocabulary_color_crop_2000.yml" << endl;
    FileStorage fs_vocabulary("c:\\img\\train\\vocabulary_color_surf_2000.yml", FileStorage::WRITE);
    fs_vocabulary << "vocabulary" << vocabulary;
    fs_vocabulary.release();

    return 0;
} 
  
 
  
 
   
  step 2: 训练数据像聚类中心映射，得到每一个训练数据在该聚类中心空间的一个低维表示。 
   
  bool ReadImageNamesAndLabels(std::vector& image_file_names, std::vector& image_labels, std::string folder, std::string list_file_name)
{
    using namespace std;
    ifstream label_list_file(folder + list_file_name);
    if (!label_list_file)
        return false;
    string fname;
    string label;
    while (!label_list_file.eof())
    {
        label_list_file >> fname >> label;
        if (fname.length() == 0 || label.length() == 0)
            continue;
        image_file_names.push_back(folder + fname + ".jpg");
        image_labels.push_back(label);
    }
    label_list_file.close();
    return true;
}

void ExtractTrainingSamples(cv::Ptr& detector, cv::BOWImgDescriptorExtractor& bowide, std::map& classes_training_data)
{
    using namespace cv;
    using namespace std;

    vector image_file_names;
    vector image_labels;
    //ReadImageNamesAndLabels(image_file_names, image_labels, image_folder_path, "all.train.label");
    ReadImageNamesAndLabels(image_file_names, image_labels, "C:\\Users\\Hongze Zhao\\Downloads\\MLKD-Final-Project-Release\\ic-data\\extra\\", "extra.label");
    ReadImageNamesAndLabels(image_file_names, image_labels, "C:\\Users\\Hongze Zhao\\Downloads\\MLKD-Final-Project-Release\\ic-data\\check\\", "check.label");

    cout << "extracting training samples ...         ";
    #pragma omp parallel for
    for (int i = 0; i < image_file_names.size(); i++)
    {
        vector keypoints;
        Mat response_hist;
        string& class_label = image_labels[i];
        Mat image = imread(image_file_names[i]);//, CV_LOAD_IMAGE_GRAYSCALE);
        UnifyImageSize(image);
        detector->detect(image, keypoints);
        bowide.compute(image, keypoints, response_hist);

        #pragma omp critical
        {
            if (classes_training_data.count(class_label) == 0) // not yet created...
                classes_training_data[class_label].create(0, response_hist.cols, response_hist.type());
            classes_training_data[class_label].push_back(response_hist);

            cout << "\b\b\b\b\b\b\b\b\b";
            cout << setfill(' ') << setw(4) << i << "/" << setw(4) << image_file_names.size();
        }
    }
    cout << endl;

    cout << "saving to file ..." << endl;
    FileStorage fs("training_samples.yml", FileStorage::WRITE);
    for (map::iterator ite = classes_training_data.begin(); ite != classes_training_data.end(); ++ite)
    {
        cout << "save " << ite->first << endl;
        fs << "class" + ite->first << ite->second;
    }
    fs.release();
}
 
  
 
  
 
   
  step 3: 得到每一个训练数据的低维表示后，选择适当的分类器训练。 
   
  void TrainSVM(std::map& classes_training_data, std::string& file_postfix, int response_cols, int response_type)
{
    using namespace cv;
    using namespace std;

    vector class_names;
    for (map::iterator ite = classes_training_data.begin(); ite != classes_training_data.end(); ++ite)
        class_names.push_back(ite->first);

    // one vs. all classifiers
    #pragma omp parallel for schedule(dynamic)
    for (int i = 0; i < class_names.size(); i++)
    {
        string& class_name = class_names[i];
        cout << "training class : " << class_name << " ..." << endl;

        // copy class samples and label
        Mat samples(0, response_cols, response_type);
        Mat labels(0, 1, CV_32FC1); // 0 rows, 1 cols
        samples.push_back(classes_training_data[class_name]);
        Mat class_label = Mat::ones(classes_training_data[class_name].rows, 1, CV_32FC1);
        labels.push_back(class_label);

        // copy rest samples and label
        for (map::iterator ite = classes_training_data.begin(); ite != classes_training_data.end(); ++ite)
        {
            string not_class_name = ite->first;
            if (not_class_name == class_name)
                continue;
            Mat& not_class_mat = classes_training_data[not_class_name];
            samples.push_back(not_class_mat);
            class_label = Mat::zeros(not_class_mat.rows, 1, CV_32FC1);
            labels.push_back(class_label);
        }

        // train and save
        if (samples.rows == 0)
            continue;
        Mat sample_32f;
        samples.convertTo(sample_32f, CV_32F);
        CvSVMParams svm_param;
        svm_param.svm_type = CvSVM::C_SVC;
        svm_param.kernel_type = CvSVM::RBF;
        //svm_param.nu = 0.5; // in the range 0..1, the larger the value, the smoother the decision boundary
        svm_param.C = 5;
        svm_param.gamma = 0.1;
        //svm_param.degree = 3;
        svm_param.term_crit.epsilon = 1e-8;
        svm_param.term_crit.max_iter = 1e9;
        svm_param.term_crit.type = CV_TERMCRIT_ITER | CV_TERMCRIT_EPS;
        CvSVM svm_classifier;
        svm_classifier.train(sample_32f, labels, Mat(), Mat(), svm_param);
        //svm_classifier.train(sample_32f, labels);
        //svm_classifier.train_auto(sample_32f, labels, Mat(), Mat(), svm_param);

        // save classifier
        string classifier_file_name("SVM_classifier_");
        classifier_file_name += file_postfix + "_" + class_name + ".yml";
        svm_classifier.save(classifier_file_name.c_str());
        cout << classifier_file_name << " saved" << endl;
    }
}

int vocabularySvmTrain(string& vocabulary_file , string& postfix_for_output)
{
   

    cout << " ------- Train SVM Classifier -------" << endl;
    // read vocabulary from file
    cout << "reading vocabulary form file ..."<> vocabulary;
    fs.release();

    if (vocabulary.rows == 0)
    {
        //cerr << "Cannot Load Vocabulary File :" << argv[1] << endl;
        return -1;
    }

    // setup BOWImgDescriptorExtractor with vocabulary
    Ptr feature_detector(new SurfFeatureDetector(400));
    //Ptr feature_detector = Ptr(new PyramidAdaptedFeatureDetector(Ptr(new SurfFeatureDetector(400))));
    //Ptr feature_detector = FeatureDetector::create("GridSURF");
    //Ptr descriptor_extractor(new SurfDescriptorExtractor());
    Ptr descriptor_extractor(new OpponentColorDescriptorExtractor(Ptr(new SurfDescriptorExtractor(400))));
    Ptr descriptor_matcher(new FlannBasedMatcher());
    //Ptr descriptor_matcher(new BruteForceMatcher>());
    BOWImgDescriptorExtractor bowide(descriptor_extractor, descriptor_matcher);
    bowide.setVocabulary(vocabulary);

    descriptor_matcher->train(); // call this to load dll, for omp

    // setup training data for classifiers and extract samples from image files
    map classes_training_data;
    ExtractTrainingSamples(feature_detector, bowide, classes_training_data);

    // show samples information
    cout << "Got " << classes_training_data.size() << " classes." << endl;
    for (map::iterator ite = classes_training_data.begin(); ite != classes_training_data.end(); ++ite)
        cout << "class " << ite->first << " has " << ite->second.rows << " samples" << endl;

    // train SVM for each classes
    cout << "Training SVMs" << endl;
    string postfix = postfix_for_output;
    TrainSVM(classes_training_data, postfix, bowide.descriptorSize(), bowide.descriptorType());

    system("pause");
    return 0;
} 
  
 
  
 
   
  step 4: 对新来的样本先映射到聚类中心空间，然后利用得到的分类器进行预测。 
   
  // resize to 256x256
void ProcessImage(const cv::Mat& image, cv::Mat& unified_image)
{
    int s = cv::min(image.rows, image.cols);
    float scale = 256.0 / s;
    scale = scale < 1.0 ? scale : 1.0;
    Size size(image.cols  * scale, image.rows * scale);
    cv::resize(image, unified_image, size);
    cv::GaussianBlur(unified_image, unified_image, Size(11, 11), 5.0);
}

SVMPredictor::SVMPredictor(std::string vovabulary_file_name, std::string svm_classifier_file_name):
    feature_detector(new SurfFeatureDetector()), 
    descriptor_matcher(new BruteForceMatcher>),
    //descriptor_matcher(new FlannBasedMatcher()),
    descriptor_extractor(new OpponentColorDescriptorExtractor(Ptr(new SurfDescriptorExtractor())))
{
    bool ret = LoadVocabulary(vovabulary_file_name);
    assert(ret);
    ret = LoadSVMClassifier(svm_classifier_file_name);
    assert(ret);
    bowide = Ptr(new BOWImgDescriptorExtractor(descriptor_extractor, descriptor_matcher));
    bowide->setVocabulary(vocabulary);
}


SVMPredictor::~SVMPredictor(void)
{
}

bool SVMPredictor::LoadVocabulary(std::string file_name)
{
    try
    {
        FileStorage fs(file_name, FileStorage::READ);
        fs["vocabulary"] >> vocabulary;
        fs.release();
    }
    catch(...)
    {
        cerr << "LoadVocabulary error" << endl;
        return false;
    }
    if (vocabulary.rows == 0)
        return false;
    return true;
}

bool SVMPredictor::LoadSVMClassifier(std::string file_name)
{
    try
    {
        svm.load(file_name.c_str());
    }
    catch (...)
    {
        cerr << "LoadSVMClassifiers error" << endl;
        return false;
    }
    return true;
}

std::string SVMPredictor::PredictClass(cv::Mat& input_image)
{
    Mat unified_image;
    ProcessImage(input_image, unified_image);

    vector keypoints;
    Mat response_hist;
    feature_detector->detect(unified_image, keypoints);
    bowide->compute(unified_image, keypoints, response_hist);
    int predict_result = (int)svm.predict(response_hist);

    char class_buf[8];
    itoa((int)predict_result, class_buf, 10);
    return class_buf;
} 
  
 
  图片快速分类 
   
  ImageClassPredictor::ImageClassPredictor(std::string vocabulary_file_name, std::string classifier_file_prefix): 
    feature_detector(new SurfFeatureDetector(400)), 
    //descriptor_matcher(new BruteForceMatcher>),
    descriptor_matcher(new FlannBasedMatcher()),
    descriptor_extractor(new OpponentColorDescriptorExtractor(Ptr(new SurfDescriptorExtractor(400))))
{
    bool ret = LoadVocabulary(vocabulary_file_name);
    assert(ret);
    ret = LoadSVMClassifiers(classifier_file_prefix);
    assert(ret);
    //feature_detector = Ptr(new PyramidAdaptedFeatureDetector(Ptr(new SurfFeatureDetector(400))));
    bowide = Ptr(new BOWImgDescriptorExtractor(descriptor_extractor, descriptor_matcher));
    bowide->setVocabulary(vocabulary);
    descriptor_matcher->train();
}

ImageClassPredictor::~ImageClassPredictor(void)
{
}

bool ImageClassPredictor::LoadVocabulary(std::string file_name)
{
    try
    {
        FileStorage fs(file_name, FileStorage::READ);
        fs["vocabulary"] >> vocabulary;
        fs.release();
    }
    catch(...)
    {
        cerr << "LoadVocabulary error" << endl;
        return false;
    }
    if (vocabulary.rows == 0)
        return false;
    return true;
}

bool ImageClassPredictor::LoadSVMClassifiers(std::string file_prefix)
{
    const int classes_count = 10; // totally 10 classes of images
    classes_classifiers.clear();
    try
    {
        for (int i = 0; i < classes_count; i++)
        {
            char class_name[4];
            itoa(i + 1, class_name, 10);
            string file_name = file_prefix + class_name + ".yml";
            //classes_classifiers.insert(pair(class_name, CvSVM()));
            classes_classifiers[class_name].load(file_name.c_str());
        }
    }
    catch (...)
    {
        cerr << "LoadSVMClassifiers error" << endl;
        return false;
    }
    return true;
}

// resize to 256x256
void UnifyImageSize(const cv::Mat& image, cv::Mat& unified_image)
{
    int s = cv::min(image.rows, image.cols);
    //float scale = 256.0 / s;
    //Size size(image.cols  * scale, image.rows * scale);
    Size size(128, 128);
    cv::resize(image, unified_image, size);
    //cv::GaussianBlur(unified_image, unified_image, Size(3, 3), 3.0);
    //cv::filter2D(unified_image, unified_image, unified_image.depth(), CV_MEDIAN);
    cv::medianBlur(unified_image, unified_image, 3);
}

std::string ImageClassPredictor::PredictClass(Mat& input_image)
{
    Mat unified_image;
    UnifyImageSize(input_image, unified_image);

    // sliding window approach
    const int window_size = 128; // unified_image.rows < 128 || unified_image.cols < 128 ? cv::min(unified_image.cols, unified_image.rows) : 128;
    vector check_points;
    for (int i = 0; i < unified_image.cols; i += window_size / 4)
        for (int j = 0; j < unified_image.rows; j += window_size / 4)
            check_points.push_back(Point(i, j));

    map > found_classes;

    #pragma omp parallel for
    for (int i = 0; i < check_points.size(); i++)
    {
        Point& p = check_points[i];
        // crop window image
        Mat image;
        unified_image(Rect(p.x - window_size/2, p.y - window_size/2, window_size, window_size) & Rect(0, 0, unified_image.cols, unified_image.rows)).copyTo(image);

        if (image.rows == 0 || image.cols == 0)
            continue;
        // detect keypoints
        vector keypoints;
        Mat response_hist;
        feature_detector->detect(image, keypoints);
        bowide->compute(image, keypoints, response_hist);
        if (response_hist.cols == 0 || response_hist.rows == 0)
            continue;
        
        // predict window image
        try
        {
            float min_distance = FLT_MAX;
            string min_class = "!";
            for (map::iterator ite = classes_classifiers.begin(); ite != classes_classifiers.end(); ++ite)
            {
                // signed distance to the margin (support vector)
                float predict_distance = ite->second.predict(response_hist, true);
                if (predict_distance > 1.0)
                    continue;
                if (predict_distance < min_distance)
                {
                    min_distance = predict_distance;
                    min_class = ite->first;
                }
            }
            if (min_class == "!")
                continue;
            #pragma omp critical
            {
                found_classes[min_class].first++;
                found_classes[min_class].second += min_distance;
            }
        }
        catch (cv::Exception)
        {
            continue;
        }
    }

    // get the best matched class
    float max_class_score = -FLT_MAX;
    string max_class;
    //cout << " -->> ";
    for (map >::iterator ite = found_classes.begin(); ite != found_classes.end(); ++ite)
    {
        float score = abs(ite->second.first * ite->second.second);
        //cout << ite->first << ", " << score << " | ";
        if (score > 1e10)
            continue;   // impossible score
        if (score > max_class_score)
        {
            max_class_score = score;
            max_class = ite->first;
        }
    }
    //cout << endl;
    //cout << "max_score = " << max_class_score << endl;
    return max_class;
} 
  
 
  测试 
   
  int _tmain(int argc, _TCHAR* argv[])
{
	std::string vb_path="c:\\svm\\vocabulary_color_surf_toy.yml";
	std::string svm_path="c:\\svm\\SVM_classifier__0.yml";
	SVMPredictor predictor(vb_path, svm_path);
	//std::cout << "predicting images ...         " << std::endl;
	//Mat image=imread(argv[1]);
	Mat image = imread("c:\\img\\3333.jpg");
	//Mat img = imread("G:\\svm\\3333.jpg");
	//Mat image;
	//cvtColor(img,image,CV_BGR2GRAY);
    //imshow("test",image);	//cvWaitKey(0);
	if (image.rows == 0 || image.cols == 0)
	{
		std::cout  << " test iamge read error!" << endl;
		return 0;
	}
	string predict_label = predictor.PredictClass(image);
	if(predict_label=="1")
	{
			//printf("1");
			return 1;
	}
	else
	{
		std::string svm_path="c:\\svm\\SVM_classifier__1.yml";
		SVMPredictor predictor(vb_path, svm_path);
		std::cout << "predicting images ...         " << std::endl;
		string predict_label = predictor.PredictClass(image);
		if(predict_label=="1")
		{
				//printf("2");
				return 2;
		}
		else
		{
			//printf("-1");
			return 0;
		}
	}
} 
  
 
  
 
  
 
  
 
  在视觉领域，很希望能够利用已知的目标或者图像去得到相关的信息，这在机器人......等领域有着很广泛的应用，所以利用视觉领域中图像检索这一块解释一些基本问题。
Vocabulary建立(数据聚类)：
以SIFT 128维特征作为例子。例如现在有1000张训练图片，对每一张训练图片都提取SIFT的128维特征，那么最终可以得到 N(i) * 128的特征，N(i)代表第几张图特征点的个数，因为图片并非完全相同，所以特征点的个数当然是不一样的。接下来就是建立词典的过程，利用现在常用的一些聚类算法，kmeans就OK，选择聚类中心点的个数，1000个也好， 10000个也罢，聚类完成后，得到的就是一个1000(10000) * 128聚类中心点的空间，称之为词典。
这个词典就好比一个容器，通俗一点就是一个直方图的基，利用这个基去统计这些训练样本的个信息。
训练样本的映射:
此时已经得到了一个直方图的基，如下图：

 
   
   X 
   
  
 
  图1： 图中，n表示聚类中心点的个数，用BOW中的文字表示即使字典的个数。 
  
 
  这些直方图的基在像是在空间的一些三维空间的基向量i, j, k， 利用这些基向量去构造别的向量，只需要知道特定的系数就行。所以接下来的步骤就是将原始的图像特征（SIFT 128维）向这些基向量作映射，得到相关的系数，如图: 
  
 
   
  
 
  图2：上图中给出了两个类别的直方图 
  
 
  通过相关的映射，得到不同类别的一个类别的直方图的统计，这样整个BOW特征提取过程就算是完全实现了。接下来如何进行匹配，就是选择分类器的问题了。 
  
 
  分类器的选择： 
  
 
  其实BOW之所以有bag的意思也是将相似的特征进行打包，得到统计的一个范围，这个范围就是直方图的某一个bin。在进行图像检索的时候，接下来就是进行分类器的训练与识别了，例如朴素贝叶斯分类器，支持向量机之类。一般利用BOW的时候，大多数人还是选择支持向量机这玩意，有实验证明BOW结合SVM效果要好于其他的分类器。不过，我没做过对比实验，这里也算提一下。 
  
 
  新来样本的识别： 
  
 
  在训练好分类器后，对于新来的样本，同样先提取SIFT特征，然后将SIFT特征映射到上面图1中的词典中去，然后得到的直方图就可以通过分类器进行分类了。如： 
   
  
图3 新图片的BOW直方图特征
上图是一张新图映射到词典时得到的直方图，可以看出，这张图片相对于图2的情况而言，更接近类别1，所以通过分类器，理想的装填应该是判断为1。 但是我们都知道，理想状态的出现可能性太小，所以BOW难免会有出错的时候，通过阅读几篇论文，发现现在BOW的识别率大概在60%-80%之间，当然了一方面是数据量巨大的问题，另外一方面也是因为图像之间的相似度高。所以整体来讲，BOW的识别率还是再可以接受的范围。
心得：
其实BOW没有什么特别的理论推导，我觉得仅仅只是将类似SIFT、HOG这些局部特征的统计方法从微观扩展到宏观的过程，利用直方图的统计的特性，构造多个词典，利用简单的距离映射，得到每一副图片的BOW的特征，但是这样一个简单的扩展确实最重要的创新点，同时也构造了一个广泛应用的框架。

【亲测免费】 PyPandoc 项目常见问题解决方案
PyPandoc项目常见问题解决方案基础介绍PyPandoc是一个为Pandoc提供的Python薄壳包装器。Pandoc是一个通用的文档转换工具，能够将标记格式的文档转换为多种格式。PyPandoc主要使用Python编程语言，旨在简化Pandoc在Python项目中的使用。新手常见问题及解决步骤问题1：如何安装PyPandoc问题描述：新手在使用PyPandoc时，首先需要了解如何正确安装。解
青少年人工智能Python编程水平测试四级模拟试卷9 试题解析编程小伙伴测评网 YCL 试题详解 python 开发语言少儿编程青少年编程算法数据结构排序算法
1、以下选项中，说法正确的是？（）A、条件1and条件2，表示条件满足其中1个即可B、条件1or条件2，表示2个条件需要同时满足C、and和or不能在一个条件表达式中同时使用D、andor一般和if语句搭配使用正确答案：D试题解析：and是逻辑与，同时满足结果才满足；or是逻辑或，满足一个结果就是满足；
ES from、size用法化石心
from,size使用from表示从第几条起，size是查询多少条，默认是10有点类似limit0,10GET_search{"from":"0","size":"10","qeury":{"term":{"filed":2}}}请注意，from+size不能超过index.max_result_window默认设置为10,000的索引设置。有关进行深度滚动的更有效方法请参见Scroll或Sear
mongodb-org-server_8.0.11_amd64.deb 这个文件怎么安装小李飞刀李寻欢 OpenSource 数据库大数据搜索引擎 mongodb
参考博文：mongodb-org-mongos:Depends:libssl1.1(＞=1.1.1)butitisnotinstallable-CSDN博客要安装mongodb-org-server_8.0.11_amd64.deb文件，需要使用dpkg命令。不过在此之前，有几点需要注意：MongoDB官方版本目前最高为6.0，8.0.11可能是第三方或测试版本，请确认来源可靠性安装.deb包可能
十年老Python程序员：给我一个链接，没有我不能爬的视频，只有我顶不住的视频 IT孔乙己
一、写在前面真的，为什么别人发游戏这么多人看，我发了两次了加起来才一百个。算了算了，不整游戏了，反正你们也不爱看~python今天来试试把头条上扭腰上热门的那些妹子爬一爬，不知道我顶不顶得住~python二、准备工作1、使用的环境python3.8pycharm2021.2专业版2、要用的第三方模块seleniumrequestsparsel三、大致流程鉴于你们不喜欢我啰嗦，但是流程呢，我还是要给
Kubernetes 资源管理
一、ResourceQuota首先看一下ResourceQuota（资源配额）的使用，资源配额是限制某个命名空间对资源使用的一个总量限制，比如内存、CPU、Pod数量等。1.什么是资源配额在生产环境中，可能会有多个Kubernetes集群，面向开发环境、测试环境、预生产环境和生产环境等。身为Kubernetes管理员，必然知道每个环境的规模有多大、可调度资源有多少，并且知道如何合理地为容器分配内存
如何使用 OpenCV 打开指定摄像头
在计算机视觉应用中，经常需要从特定的摄像头设备获取视频流。例如，在多摄像头环境中，当使用OpenCV的cv::VideoCapture类打开摄像头时，如果不指定摄像头的ID，可能会随机打开系统中的某个摄像头，或者按照设备连接的顺序打开第一个可用的摄像头。比如： //打开两个摄像头 cv::VideoCapture cap0(0); if (!cap0.isOpened()){ c
Python 进阶（一）：多线程
目录1.相关概念1.1解释器1.2GIL2.threading2.1方法属性2.2线程对象2.3锁对象2.4条件对象2.5信号量对象2.6事件对象1.相关概念1.1解释器Python解释器的主要作用是将我们在.py文件中写好的代码交给机器去执行，比较常见的解释器包括如下几种：CPython：官方解释器，我们从官网下载安装后获得的就是这个解释器，它使用C语言开发，是使用范围最广泛的Python解释器
word python 域操作_Python进阶：关于 Word 基本操作铃木大宝 word python 域操作
1.概述Word是一个十分常用的文字处理工具，通常我们都是手动来操作它，本节我们来看一下如何通过Python来操作。Python提供了python-docx库，该库就是为Word文档量身定制的，安装使用pipinstallpython-docx命令即可。2.写入首先，我们使用Python来创建一个Word文档并向其中写入一些内容。2.1标题我们先来创建Word文档并向其中添加标题，完整实现代码如下
HAL STM32 I2C方式读取MT6701磁编码器获取角度例程 perseverance52 嵌入式开发笔记 stm32 MT6701
HALSTM32I2C方式读取MT6701磁编码器获取角度例程相关篇《Arduino通过I2C驱动MT6701磁编码器并读取角度数据》《STM32软件I2C方式读取MT6701磁编码器获取角度例程》使用CH341编程器读取，可以参考《CH341A/BUSB转USART/I2C/SPI介绍》MT6701当前最新文档资料：https://www.magntek.com.cn/upload/MT6701
中原焦点网络初级班第32期学员赵妮坚持分享第20天（2021年12月08日） 3c3a028fd47e
有效提取，无效改变。焦点解决需要活学活用。焦点解决有三条重要的原则：如果没有用，就不要固着在这件事上；如果没有用，做点别的事情；如果有用，就多做一点。帮忙改变的技巧：1、要先知道这个咨询对象的目标在哪里。2、借由将目前的行为与目标对比，来促使其发现目前使用的方法无效。3、引导咨询对象换点儿别的事情做。4、鼓励与约定。
解决当word出现打开时弹出窗口VBE6EXT.OLB不能被加载后继续提出“未知错误50001”以及宏定义找不到问题 sunnywmy word 宏定义
当word出现打开时弹出窗口VBE6EXT.OLB不能被加载后继续提出“未知错误50001”以及宏定义找不到你好！这是我在使用的时候莫名其妙出现的问题。问题描述解决办法找到C:\ProgramFiles(x86)\CommonFiles\microsoftshared\VBA\VBA6下的VBE6EXT.OLB文件，复制到C:\ProgramFiles\CommonFiles\MicrosoftS
抖音极速版邀请码是多少，赚钱版的抖音极速版邀请是哪些？资源共享猫
抖音极速版作为抖音的轻量级版本，不仅保留了抖音的核心功能，还加入了更多赚钱机制，让用户在使用的同时能够获得一定的收益。而邀请码系统则是抖音极速版为了鼓励用户邀请新用户加入而推出的一项福利政策。通过邀请码，新老用户可以建立绑定关系，共享平台带来的乐趣和奖励。抖音极速版邀请码是多少？截至当前时间（请注意，随着时间推移，邀请码可能会发生变化），抖音极速版的邀请码是AF2854816、AF71575721
华为OD机试 - 通过软盘拷贝文件(2025 A卷 200分) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025A卷真题笔试算法
通过软盘拷贝文件真题目录:点击去查看2025A卷100分题型题目描述有一名科学家想要从一台古董电脑中拷贝文件到自己的电脑中加以研究。但此电脑除了有一个3.5寸软盘驱动器以外，没有任何手段可以将文件持贝出来，而且只有一张软盘可以使用。因此这一张软盘是唯一可以用来拷贝文件的载体。科学家想要尽可能多地将计算机中的信息拷贝到软盘中，做到软盘中文件内容总大小最大。已知该软盘容量为1474560字节。文件占用
111.添加点击岐黄慧问图标返回到个人信息页面功能
因为在知识问答界面没有添加返回个人界面的功能，所以特意给其添加上：点击之后会调用gotohome方法：然后使用路由跳转到profile界面这是悬停时显示的效果，可以轻微放大点击之后就可以跳转回原界面
90-15:“复盘”你造吗？祎苒
这段时间在我耳边出现了一个高频词——复盘。担心自己跟不上步伐似的，不知不觉地在与别人聊天时也偶尔学人“蹦”出这个词出来。但这个词大家现在频繁使用它只是表达字面的意思绪呢？还是有深一层的含义呢？这词的出现是否有什么典故或又该如何正确使用呢？带着这种种的疑问，今天我在查阅资料时，意外地又发现了这个词，顺藤摸瓜下找到了一丝的线索，故录载下来。复盘是围棋术语，意思是下完一盘棋，把棋子撤走后，重新按照刚才下
Q10900H6迷你电脑：集成双10G+四2.5G网口，支持多系统网络部署 QotomPC 电脑 5G 网络
QotomQ10900H6系列是一款小型、无风扇设计的多网口迷你电脑，适合需要多网口、高带宽和长时间稳定运行的网络环境使用。整机尺寸为196×122×47mm，重量约1.23kg，便于安装在桌面、弱电箱或小型机柜中。该系列支持多种英特尔低功耗处理器，包括AlderLake-N和TwinLake-N平台，处理器型号覆盖N100、i3-N305、N150和i3-N355，可根据使用需求选择不同性能等级
MySQL索引深度解析：从原理到实战优化
本文将深入探讨MySQL索引的核心机制、工作原理及高级优化技巧，通过原理分析、实战案例和可视化演示，帮助您全面掌握索引这一数据库性能优化的关键利器。一、索引的本质与重要性1.1什么是索引？索引是数据库中用于快速查找数据的数据结构，类似于书籍的目录。MySQL索引基于B+树数据结构实现，这种设计使数据库能够高效地执行数据检索操作，避免全表扫描。1.2索引的重要性查询性能提升：合理使用索引可将查询速度
Markdown编辑器金麟༒ 编辑器
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导入导出导入欢迎使用Mark
Linux笔记8 web服务器的部署及优化月熊笔记 linux
用户常用关于web的信息www概念www是worldwideweb的缩写，及万维网，也就是全球信息广播的意思通常说的上网就是使用www来查询用户所需要的信息。www可以结合文字、图形、影像以及声音等多媒体，超链接的方式将信息以Internet传递到世界各处去。当你连接www网站，该网站会提供一些数据，客户端要使用可以解析这些数据的软件来处理，那就是浏览器网址URI：UniformResourceI
Linux笔记9 DNS域名解析服务器月熊服务器 linux 笔记
简介DNS（DomainNameSystem）是互联网上的一项服务，它作为将域名和IP地址相互映射的一个分布式数据库，能够使人更方便的访问互联网。DNS使用的是53端口，通常DNS是以UDP这个较快速的数据传输协议来查询的，但是没有查询到完整的信息时，就会再次以TCP这个协议来重新查询所以启动DNS时，会同时启动TCP以及UDP的port53。因特网的域名结构由于因特网的用户数量较多，所以因特网在
STM32实战开发（51）：使用I2C与外部设备通信嵌入式开发项目 2025年嵌入式开发 stm32 嵌入式硬件单片机物联网前端
1.前言I2C（Inter-IntegratedCircuit）是一种串行通信协议，它广泛应用于嵌入式系统中，尤其适用于低速设备之间的通信。I2C协议的最大特点是它采用两线制传输数据（SDA和SCL），并支持多个设备连接在同一总线上。I2C的优势包括：传输速度较快、硬件连接简单、支持多个设备、低功耗等。因此，I2C广泛应用于温湿度传感器、LCD显示器、EEPROM存储、实时钟等外设的通信。在STM
华为OD机试2025 B卷 - 通过软盘拷贝文件 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试华为OD机试 2025B卷华为OD2025B卷华为OD机考 2025B卷
通过软盘拷贝文件华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述有一名科学家想要从一台古董电脑中拷贝文件到自己的电脑中加以研究。但此电脑除了有一个3.5寸软盘驱动器以外，没有任何手段可以将文件持贝出来，而且只有一张软盘可以使用。因此这一张软盘是唯一可以用来拷贝文件的载体。科学家想要尽可能多地将计算机中的信息拷贝到
STM32硬件I2C的注意事项蓝黑墨水 stm32 单片机嵌入式硬件
文章目录软件模拟I2C硬件的实现方式最近在研究I2C的屏幕使用。有两种使用方式，软件模拟I2C、硬件HAL使用I2C。软件模拟I2C发送数据是通过设置引脚的高低电平实现的。/*引脚配置*/#defineOLED_W_SCL(x)GPIO_WriteBit(GPIOB,GPIO_Pin_6,(BitAction)(x))#defineOLED_W_SDA(x)GPIO_WriteBit(GPIOB,
Java String 正则表达式设计模式包装类 Object类自动拆箱额么么么么 java 正则表达式设计模式
其它API（ApplicationProgramingInterface）应用程序接口（功能）,我们java讲解最常用的一些功能。API作用：API表示的是功能,学习API可以快速进行编程开发。API设计初衷,设计者将复杂的业务逻辑,封装成方法,供调用者更好的使用。对于开发者而言,不需要关注功能的具体逻辑实现,只需要知道如何使用即可。Java提供了很多的包,有一些包需要导入，有一些不需要导入:1.
docker部署dm数据库 yy1209357299 运维 Linux docker 容器运维 dm
官方文档参考官网地址：https://eco.dameng.com/document/dm/zh-cn/start/dm-install-docker.html下载镜像地址docker部署1、加载镜像dockerload-idm8_20240613_x86_rh6_64_rq_ent_8.1.3.140_pack5.tar使用dockerimages，查看镜像和镜像标签2、创建路径，挂载备用mkd
MFC数字图像处理24位图转8位图等四种图像色彩转换方式 CurtainSystem 数字图像处理数字图像处理图像色彩转换 24位图转8位图
一、实验主要思路和基本操作本实验主要探究8位图和24位图的颜色转换。8位图具有调色板，调色板中有对应的256种不同的颜色，每种颜色所含的RGB值都不一样。24位图没有调色板，RGB三个颜色分量分别都有0-255可选择，属于真彩色图像。其中，两种不同位数的图形都有彩色图像和灰度图像两种，灰度图像中每个像素的颜色分量，R、G、值都一样。所以本实验核心分为两点：了解颜色的RGB组合和学会调色板的使用调色
AndResGuard使用 CurtainSystem android android studio
1、简介AndResGuard是一个帮助你缩小APK大小的工具，他的原理类似JavaProguard，但是只针对资源。他会将原本冗长的资源路径变短，例如将res/drawable/wechat变为r/d/a。AndResGuard不涉及编译过程，只需输入一个apk(无论签名与否，debug版，release版均可，在处理过程中会直接将原签名删除)，可得到一个实现资源混淆后的apk(若在配置文件中输
基于橙武低代码平台的手工作坊成品交付流程管理方案橙武科技低代码 AI 人工智能 ai 低代码
一、成品交付的管理需求在手工作坊的运营中，成品交付是整个生产流程中的一个关键环节，涉及到多个方面的管理：从原材料的使用记录到损耗比的计算，再到最终的成品质量检查和交付确认。高效的成品交付管理不仅能够提升工作效率，还能确保成品质量，避免原材料的浪费，减少运营成本。手工作坊通常依赖于兼职人员来完成生产任务，而这些兼职人员遍布各地，通过快递接受材料并交付成品。因此，成品交付管理的自动化与精细化至关重要。
如何使用橙武低代码平台进行数据收集与分析：运营人员的月度报告生成实例橙武科技 AI deepseek 低代码低代码人工智能 ai
一、背景与目标假设我们有一个运营人员，他的任务是每月收集和整理分公司的月度订单数据，包括：订单量：每个分公司在该月的订单总数。总金额：该月订单的总销售金额。退单量：该月退货的订单数。退单金额：退货订单的总金额。退单原因Top1：退单中最常见的原因。这些数据需要运营人员手动从各个分公司的系统中收集，然后整合成一个月度报告，分析并发现潜在问题，如哪些分公司订单量下降、哪些退单原因需要关注。通过橙武低代
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

opencv使用svm

作者 群号 C语言交流中心 240137450 微信 15013593099

1）设置训练样本集

2）设置SVM参数

3）训练SVM

4）用这个SVM进行分类

5）获得支持向量

实现代码如下：

总结：

二、OpenCV中SVM的参数和函数说明

1、训练参数结构体 CvSVMParams (可参考 【OpenCV2.4】SVM的参数和函数介绍 )

2、支持向量机 CvSVM 类(8个函数)

<1>构造函数的原型

(2)训练函数

(3)自动训练函数

(4)预测函数

(5)生成SVM网格参数的函数

(6)获取当前SVM参数的函数

(7)获取支持向量及其数量的函数

(8)获取所用特征的数量的函数

三、OpenCV的简单的程序例子

四、SVM处理流程总结：

SVM样本训练步骤

1、引言

2、步骤

（1）生成SVM描述文件；

（2）将描述文件读入容器中；

（3）读入样本数量，生成样本矩阵和类型矩阵

（4）读入样本图像

（5）提取HOG特征

（6）将HOG特征写入txt文件

（7）进行SVM训练

BOW特征提取函数（特征点篇）

一、train

二、predict

1.特征点提取

2.特征描述符提取

Bag of Word闲谈

step 1: 大数据聚类，找到适当的聚类中心点----Vocabulary。

step 2: 训练数据像聚类中心映射，得到每一个训练数据在该聚类中心空间的一个低维表示。

step 3: 得到每一个训练数据的低维表示后，选择适当的分类器训练。

step 4: 对新来的样本先映射到聚类中心空间，然后利用得到的分类器进行预测。

图片快速分类

测试

你可能感兴趣的:(opencv使用svm)

作者群号 C语言交流中心 240137450 微信 15013593099

1、训练参数结构体 CvSVMParams (可参考【OpenCV2.4】SVM的参数和函数介绍 )