kobesdu

LibSVM-2.6 程序代码

第一节： SVM.h 文件

structsvm_node

{

int index;

double value;

};

structsvm_node 用来存储单一向量中的单个特征，例如：

向量 x1={ 0.002, 0.345, 4, 5.677};

那么用 structsvm_node 来存储时就使用一个包含5个 svm_node的数组来存储此4维向量，内存

映象如下：

1 2 3 4 －1

0.002 0.345 4．000 5.677 空

其中如果 value 为 0.00,该特征将不会被存储，其中(特征 3)被跳过：

1 2 4 5 －1

0.002 0.345 4．000 5.677 空

0.00 不保留的好处在于，做点乘的时候，可以加快计算速度，对于稀疏矩阵，更能充分体现这种

数据结构的优势。但做归一化时，操作就比较麻烦了。

（类型转换不再说明）

structsvm_problem

{

int l;

double *y;

structsvm_node **x;

};

structsvm_problem存储本次参加运算的所有样本（数据集），及其所属类别。在某些数据挖掘

实现中，常用DataSet来实现。

int l;记录样本总数

double *y;指向样本所属类别的数组。在多类问题中，因为使用了one-agianst-one方法，可能原始

样本中y[i]的内容是1.0，2.0，3.0，…,但参与多类计算时，参加分类的两类所对应的y[i]内容是+1,

和－1。

Struct svm_node **x;指向一个存储内容为指针的数组；

如下图,最右边的四个长条格同上表，存储三维数据。(黑边框的是最主要的部分)

Y[3]

Y[2]

Y[1]

Y[0]

L=4

X** 上海交通大学模式分析与机器智能实验室

这样的数据结构有一个直接的好处，可以用x[i][j]来访问其中的某一元素（如果value为0.00

的也全部保留的话）

私下认为其中有一个败笔，就是把svm_node* x_space放到结构外面去了。

enum { C_SVC, NU_SVC, ONE_CLASS,EPSILON_SVR, NU_SVR };/* svm_type */

enum { LINEAR, POLY, RBF, SIGMOID }; /*kernel_type */

structsvm_parameter

{

intsvm_type;//SVM类型，见前enum

int kernel_type;//核函数

double degree; /* for poly */

double gamma; /* for poly/rbf/sigmoid */

double coef0; /* for poly/sigmoid */

/* these are for training only */

double cache_size; /* in MB */

double eps; /* stopping criteria */

double C; /* for C_SVC, EPSILON_SVR andNU_SVR */

int nr_weight; /* for C_SVC */

int *weight_label; /* for C_SVC */

double* weight; /* for C_SVC */

double nu; /* for NU_SVC, ONE_CLASS, andNU_SVR */

double p; /* for EPSILON_SVR */

intshrinking; /* use the shrinkingheuristics */

int probability; /* do probabilityestimates */

};

部分参数解释,(附核函数)

1、 j

i j i

K(x , x ) = x x

2、 ( , ) = (γ + ) ,γ > 0

i j i

K x x x x r

3、 ( , ) exp( ), 0

K xi

= −γ xi

− xj

γ >

4、K(x , x ) tanh( x xr)

i j

= γ i

double degree;//就是2式中的d

double gamma; //就是2,3,4式中的gamma

double coef0;//就是2,4式中的r

double cache_size; /* in MB */ 制定训练所需要的内存，默认是40M，LibSVM2.5中是4M,所以自

己做开发选LibSVM2.5还是不错的！

double eps;见参考文献[1]中式3.13

double C;//没什么好说的，惩罚因子，越大训练的模型越那个…,当然耗的时间越多上海交通大学模式分析与机器智能实验室

int nr_weight;//权重的数目,目前在实例代码中只有两个值，一个是默认0，另外一个是

svm_binary_svc_probability函数中使用数值2。

int *weight_label;//权重，元素个数由nr_weight决定.

double nu;// 没什么好说的,too

double p;// 没什么好说的,three

intshrinking;//指明训练过程是否使用压缩。

int probability;//新增，指明是否要做概率估计

structsvm_model

{

svm_parameter param; // parameter

int nr_class; // number of classes, = 2 inregression/one class svm

int l; // total #SV

svm_node **SV; // SVs (SV[l])

double **sv_coef; // coefficients for SVsin decision functions (sv_coef[n-1][l])

double *rho; // constants in decisionfunctions (rho[n*(n-1)/2])

double *probA; // pariwise probabilityinformation

double *probB;

// for classification only

int *label; // label of each class(label[n])

int *nSV; // number of SVs for each class(nSV[n])

// nSV[0] + nSV[1] + ... + nSV[n-1] = l

// XXX

intfree_sv; // 1 if svm_model is created bysvm_load_model

// 0 if svm_model is created by svm_train

};

结构体svm_model用于保存训练后的训练模型，当然原来的训练参数也必须保留。

svm_parameter param; // 训练参数

int nr_class;// 类别数

int l; // 支持向量数

svm_node **SV; // 保存支持向量的指针，至于支持向量的内容，如果是从文件中读取，内容会

额外保留；如果是直接训练得来，则保留在原来的训练集中。如果训练完成后需要预报，原来的

训练集内存不可以释放。

double **sv_coef;//相当于判别函数中的alpha

double *rho; //相当于判别函数中的b

double *probA; // pariwise probabilityinformation

double *probB;//均为新增函数

int *label; // label of each class(label[n])

int *nSV; // number of SVs for each class(nSV[n])

intfree_sv;//见svm_node **SV的注释上海交通大学模式分析与机器智能实验室

//以下接口函数设计得非常合理，最后一节详细说明

//最主要的驱动函数，训练数据

struct svm_model*svm_train(conststructsvm_problem *prob, conststructsvm_parameter *param);

//用SVM做交叉验证

voidsvm_cross_validation(conststructsvm_problem *prob, conststructsvm_parameter*param, int

nr_fold, double *target);

//保存训练好的模型到文件

intsvm_save_model(const char*model_file_name, conststruct svm_model *model);

//从文件中把训练好的模型读到内存中

struct svm_model *svm_load_model(const char*model_file_name);

intsvm_get_svm_type(conststruct svm_model*model);

//得到数据集的类别数（必须经过训练得到模型后才可以用）

intsvm_get_nr_class(conststruct svm_model*model);

//得到数据集的类别标号（必须经过训练得到模型后才可以用）

void svm_get_labels(conststruct svm_model*model, int *label);

//LibSvm2.6新增函数

double svm_get_svr_probability(conststructsvm_model *model);

//用训练好的模型预报样本的值，输出结果保留到数组中。（并非接口函数）

void svm_predict_values(conststructsvm_model *model, conststructsvm_node *x, double*

dec_values);

//预报某一样本的值

double svm_predict(conststruct svm_model*model, conststructsvm_node *x);

// LibSvm2.6新增函数

double svm_predict_probability(conststructsvm_model *model, conststructsvm_node *x, double*

prob_estimates);

//消除训练的模型，释放资源

void svm_destroy_model(struct svm_model*model);

// LibSvm2.6新增函数

void svm_destroy_param(structsvm_parameter*param);

//检查输入的参数，保证后面的训练能正常进行。上海交通大学模式分析与机器智能实验室

const char*svm_check_parameter(conststructsvm_problem *prob, conststructsvm_parameter

*param);

// LibSvm2.6新增函数

intsvm_check_probability_model(conststructsvm_model *model); 上海交通大学模式分析与机器智能实验室

第二节： SVM.cpp 文件

.头文件：

从整个.cpp 文件来看，感觉有些头文件是多余的，不知何故，反正多包含头文件不会犯错。

后面的 typedef,特别是 typedef float Qfloat,是为了方便控制内存存储的精度。

#include <math.h>

#include <stdio.h>

#include <stdlib.h>

#include <ctype.h>

#include <float.h>

#include <string.h>

#include <stdarg.h>

#include "svm.h"

typedef float Qfloat;

typedefsigned charschar;

//.以下是定义的几个主要的模板，主要是为了比较大小，交换数据和完全复制数据。

Min()和 Max()在<math.h>中提供了相应的函数，这里的处理，估计是为了使函数内联，执行速度

会相对快一些，而且不同的数据类型，存储方式不同，使用模板会更有针对性，也从另外一方面

提高程序性能。

#ifndef min

template <class T> inline T min(T x,Ty) { return (x<y)?x:y; }

#endif

#ifndef max

template <class T> inline T max(T x,Ty) { return (x>y)?x:y; }

#endif

template <class T> inline voidswap(T& x, T& y) { T t=x; x=y; y=t; }

//这里的克隆函数是完全克隆，不同于一般的复制。操作结束后，内部的所有数据和指针完全一

样。

template <class S, class T> inlinevoid clone(T*& dst, S* src, int n)

{

dst = new T[n];

memcpy((void *)dst,(void*)src,sizeof(T)*n);

}

//这里使用了 define，非内联函数

#define INF HUGE_VAL

#define Malloc(type,n) (type*)malloc((n)*sizeof(type)) 上海交通大学模式分析与机器智能实验室

//以下的函数用作调试。跳过～

#if 1

void info(char *fmt,...)

{

va_list ap;

va_start(ap,fmt);

vprintf(fmt,ap);

va_end(ap);

}

void info_flush()

{

fflush(stdout);

}

#elsevoid info(char *fmt,...) {}

void info_flush() {}

#endif

//以下部分为 svm.cpp 中的类继承和组合图: (实线表示继承关系，虚线表示组合关系)

2.1 类Cache

本类主要负责运算所涉及的内存的管理，包括申请、释放等。

类定义:

class Cache

{

public:

Cache(int l,intsize);

~Cache();

int get_data(const int index, Qfloat**data, int len);

void swap_index(int i, int j); //future_option

private:

int l;

intsize;

struct head_t

{

Cache

Kernel

ONE_CLASS_Q

SVC_Q

SVR_Q

Solver

Solver_NU上海交通大学模式分析与机器智能实验室

head_t *prev, *next; // a cicular list

Qfloat *data;

int len; // data[0,len) is cached in thisentry

};

head_t* head;

head_t lru_head;

void lru_delete(head_t *h);

void lru_insert(head_t *h);

};

成员变量：

head_t* head; //变量指针，该指针用来记录程序所申请的内存，单块申请到的内存用struct

head_t来记录所申请内存的指针，并记录长度。而且通过双向的指针，形成链表，增加寻址的速

度。记录所有申请到的内存，一方面便于释放内存，另外方便在内存不够时适当释放一部分已经

申请到的内存。

head_t lru_head; //双向链表的头。

int l; //样本总数。

intsize; //所指定的全部内存，据说用Mb做单位。

成员函数：

void lru_delete(head_t *h); //从双向链表中删除某个元素的链接，不删除、不释放该元素所

涉及的内存。一般是删除当前所指向的元素。

void lru_insert(head_t *h); //在链表后面插入一个新的链接；

Cache(int l,intsize);

构造函数。该函数根据样本数 L，申请 L个 head_t的空间。根据说明，该区域会初始化为 0，

（表示怀疑）。Lru_head 因为尚没有 head_t 中申请到内存，故双向链表指向自己。至于 size 的

处理，先将原来的byte 数目转化为 float的数目，然后扣除L个 head_t的内存数目。size 为程序

指定的内存大小 4M/40M。size 不要设得太小。

int get_data(const int index, Qfloat**data, int len);

该函数保证head_t[index]中至少有 len个float的内存，并且将可以使用的内存块的指针放在

data 指针中。返回值为申请到的内存。

函数首先将head_t[index]从链表中断开,如果head_t[index]原来没有分配内存，则跳过断开这

步。计算当前 head_t[index]已经申请到的内存，如果不够，释放部分内存（怀疑这样做的动机：

老数据为什么就可以释放，而不真的另外申请一块？老数据没用了？），等内存足够后，重新分

配内存。重新使 head_t[index]进入双向链表。并返回申请到的内存的长度。

//返回值不为申请到的内存的长度，为head_t[index]原来的数据长度 h->len。

Head

Lru_head上海交通大学模式分析与机器智能实验室

调用该函数后，程序会计算 ( , )

i j i j

Q =

∑y y K x x 的值，并将其填入 data 所指向的内存区

域，如果下次 index 不变，正常情况下，不用重新计算该区域的值。若 index不变，则 get_data()

返回值 len 与本次传入的 len 一致，从 Kernel::get_Q( )中可以看到，程序不会重新计算。从而提

高运算速度。

While 循环内的部分基本上难得用到一次。

void swap_index(int i, int j);

交换head_t[i] 和head_t[j]的内容，先从双向链表中断开，交换后重新进入双向链表中。对后

面的处理不理解，可能是防止中head_t[i] 和head_t[j]可能有一方并未申请内存。但 h->len > i和

h->len > j 无法解释。

for(head_t *h = lru_head.next;h!=&lru_head; h=h->next)

{

if(h->len > i)

{

if(h->len > j)

swap(h->data[i],h->data[j]);

else

{

// give up

lru_delete(h);

free(h->data);

size += h->len;

h->data = 0;

h->len = 0;

}

2.2 类 Kernel

class Kernel {

public:

Kernel(int l, svm_node * const * x,constsvm_parameter& param);

virtual ~Kernel();

static double k_function(constsvm_node *x,constsvm_node *y, constsvm_parameter& param);

virtual Qfloat *get_Q(int column, int len)const = 0;

virtual void swap_index(int i, int j) const// no so const...

{

swap(x[i],x[j]);

if(x_square) swap(x_square[i],x_square[j]);

}

protected:

double (Kernel::*kernel_function)(int i,int j) const; 上海交通大学模式分析与机器智能实验室

private:

constsvm_node **x;

double *x_square;

// svm_parameter

const int kernel_type;

const double degree;

const double gamma;

const double coef0;

static double dot(constsvm_node *px,constsvm_node *py);

double kernel_linear(int i, int j)const(skipped)

double kernel_poly(int i, int j)const(skipped)

double kernel_rbf(int i, int j)const(skipped)

double kernel_sigmoid(int i, int j)const(skipped)

};

成员变量：

const svm_node **x; //用来指向样本数据，每次数据传入时通过克隆函数来实现，完全重新

分配内存，主要是为处理多类着想。

double *x_square; //使用 RBF 核才使用。

const int kernel_type; //核函数类型.

const double degree; // kernel_function

const double gamma; // kernel_function

const double coef0; // kernel_function

成员函数：

Kernel(int l, svm_node * const * x,constsvm_parameter& param);

构造函数。初始化类中的部分常量、指定核函数、克隆样本数据。如果使用 RBF 核函数，

则计算 x-sqare[i].

static double dot(constsvm_node *px,constsvm_node *py);

点乘两个样本数据，按 svm_node中 index (一般为特征)进行运算，一般来说，index中 1，2，…

直到-1。返回点乘总和。

例如：x1 = { 1,2,3} , x2 = {4, 5, 6} 总和为sum = 1*4 + 2*5 +3*6 ;在svm_node[3]中存储index

= -1 时，停止计算。

static double k_function(constsvm_node *x,constsvm_node *y, constsvm_parameter& param);

核函数。但只有在预报时才用到。

其中 RBF 部分很有讲究。因为存储时，0 值不保留。如果所有 0 值都保留，第一个 while

就可以都做完了；如果第一个 while 做不完，在x，y中任意一个出现 index ＝ -1，第一个while

就停止，剩下的代码中两个 while只会有一个工作，该循环直接把剩下的计算做完。上海交通大学模式分析与机器智能实验室

virtual Qfloat *get_Q(int column, int len)const = 0;

纯虚函数，将来在子类中实现。相当重要的函数。

virtual void swap_index(int i, int j)

虚函数，x[i]和 x[j]中所存储指针的内容。如果 x_square 不为空，则交换相应的内容。

double (Kernel::*kernel_function)(int i,int j) const;

函数指针，根据相应的核函数类型，来决定所使用的函数。在计算矩阵 Q 时使用。

( , )

i j i j

Q =

∑y y K x x

1、 j

i j i

K(x , x ) = x x

2、 ( , ) = (γ + ) ,γ > 0

i j i

K x x x x r

3、 ( , ) exp( ), 0

K xi

= −γ xi

− xj

γ >

4、K(x , x ) tanh( x xr)

i j

= γ i

2.2 类 Solver

class Solver {

public:

Solver() {};

virtual ~Solver() {};

struct SolutionInfo {

double obj;

double rho;

double upper_bound_p;

double upper_bound_n;

double r; // for Solver_NU

};

void Solve(int l, const Kernel& Q,const double *b_, constschar *y_,

double *alpha_, double Cp, double Cn,double eps,

SolutionInfo* si, intshrinking);

protected:

int active_size;

schar *y;

double *G; // gradient of objectivefunction

enum { LOWER_BOUND, UPPER_BOUND, FREE };

char *alpha_status; // LOWER_BOUND,UPPER_BOUND, FREE

double *alpha; 上海交通大学模式分析与机器智能实验室

const Kernel *Q;

double eps;

double Cp,Cn;

double *b;

int *active_set;

double *G_bar; // gradient, if we treatfree variables as 0

int l;

bool unshrinked; // XXX

double get_C(int i) { }

void update_alpha_status(int i) { }

bool is_upper_bound(int i) { returnalpha_status[i] == UPPER_BOUND; }

bool is_lower_bound(int i) { returnalpha_status[i] == LOWER_BOUND; }

bool is_free(int i) { returnalpha_status[i] == FREE; }

void swap_index(int i, int j);

void reconstruct_gradient();

virtual intselect_working_set(int &i,int &j);

virtual double calculate_rho();

virtual void do_shrinking();

};

成员变量：

int active_size; // 计算时实际参加运算的样本数目，经过 shrink 处理后，该数目会小于全部

样本总数。

schar *y; //样本所属类别，该值只取+1/-1 。虽然可以处理多类，最终是用两类 SVM完成的。

double *G; //梯度，计算公式如下(公式 3.5)[1]：

t t

(Qα + p) = ∇f(α) =

在代码实现中，用 b[i]来代替公式中的 p。

char *alpha_status; //α[i]的状态，根据情况分为 α[i]≤ 0, α[i]≥ c和0 <α[i]< 0，分别

对应内部点(非 SV)，错分点(BSV)和支持向量(SV)。

double *alpha; //αi

const Kernel *Q; //指定核。核函数和Solver 相互结合，可以产生多种 SVC,SVR

double eps; //误差限

double *b; //见 double *G 的说明。

int *active_set; //

double *G_bar; // G

−

,（这名字取的）。计算公式如下：

G C Q i l

∑ , =1,...,

−

该值可以在对样本集做 shrink 时，减小重建梯度的计算量。上海交通大学模式分析与机器智能实验室

∑∑ < = <

= + =

ij Qij j

G G Q j

α α

0 1

int l; //样本总数

bool unshrinked; //

成员函数：

double get_C(int i)

返回对应于样本的 C。设置不同的 Cp和 Cn 是为了处理数据的不平衡。见《 6 Unbalanced

data》[1]，有时 Cp=Cn。

void swap_index(int i, int j);

完全交换样本 i和样本 j 的内容，包括所申请的内存的地址。

void reconstruct_gradient();

重新计算梯度。G_bar[i]在初始化时并未加入b[i]，所以程序首先增加 b[i]。Shrink 后依然参

加运算的样本位于active_size和L-1位置上。在0～active_size之间的alpha[i]如果在区间(0,c)上，

才有必要更新相应的 active_size和 L-1 位置上的样本的梯度。

virtual intselect_working_set(int &i,int &j)

选择工作集。公式如下：

argmin({ ( ) | 1, },{ ( ) | 1, 0}

argmax({ ( ) | 1, },{ ( ) | 1, 0}

≡∇ = − < −∇ = >

≡ −∇ = < ∇ = − >

t t t t t t

j f y C f y

i f y C f y

α α α α

virtual void do_shrinking();

对样本集做缩减。大致是当0 <α <C 时，(还有两种情况)程序认为该样本可以不参加下次

迭代。（0 <α <C 时，为内部点）程序会减小 active_size，为（内部点）增加位置。active_size

表明了不可以参加下次迭代的样本的最小标号，在 active_size 与L 之间的元素都对分类没有贡

献。

程序中 k--是为了消除交换后的影响，使重新换来的样本也被检查一次。

如果程序在缩减一次后没有达到结束条件，就重新构造梯度矢量，并再缩减一次（总觉得这

里不太严密）。

virtual double calculate_rho();

计算ρ值。见 3.7[1]节，The calculation of b or ρ

∑

< < =

∇

0 , 1

( )

C yi

C yi i

1 2

r + r

ρ =上海交通大学模式分析与机器智能实验室

void Solve(int l, const Kernel& Q,const double *b_, constschar *y_,

double *alpha_, double Cp, double Cn,double eps,

SolutionInfo* si, intshrinking);

//程序较大，逐步分解

part1

// initialize alpha_status

{

alpha_status = new char[l];

for(int i=0;i<l;i++)

update_alpha_status(i);

}

更新一下 alpha 的状态

part 2

// initialize active set (for shrinking)

{

active_set = new int[l];

for(int i=0;i<l;i++)

active_set[i] = i;

active_size = l;

}

为缩减做准备，将来要做交换

part 3

// initialize gradient

{

G = new double[l];

G_bar = new double[l];

int i;

for(i=0;i<l;i++)

{

G[i] = b[i];

G_bar[i] = 0;

}

for(i=0;i<l;i++)

if(!is_lower_bound(i))

{

Qfloat *Q_i = Q.get_Q(i,l);

double alpha_i = alpha[i];

int j;

for(j=0;j<l;j++)

G[j] += alpha_i*Q_i[j];

if(is_upper_bound(i))

for(j=0;j<l;j++) 上海交通大学模式分析与机器智能实验室

G_bar[j] += get_C(i) * Q_i[j];

}

G_bar[j]的生成公式如下：（注意，其中不包含b[i]的值）

G C Q i l

∑ , =1,...,

−

因为第一次建立 G(i),所以没有判断 alpha 的状态。而是按公式，全部计算了一遍。

get_Q(i,l)返回的值是Qij矩阵中的第 i列，而不是第 i行，这是需要注意的地方。

再往下是大循环：

如果有必要，先进行筛选，使部分数据不再参加运算；选择工作集；更新alpha_i, alpha_j,其更新

的思路是保证： j

old

i j

old

j i

new

i j

new

α y +α y =α y +α y ;对于边界情况，有特殊处理，主要是考虑

0 ≤αi

≤Ci

的要求。当某一alpha小于0时，做适当调整,调整的结果是alpha_i, alpha_j仍然在

0 ≤αi

≤Ci

范围内，同时其和同原来一样。对于推导过程，可以参考Sequential Minimal

Optimization for SVM

part 4

更新 G(i),根据αi

α j

, 的变化更新；

// update G

double delta_alpha_i = alpha[i] -old_alpha_i;

double delta_alpha_j = alpha[j] -old_alpha_j;

for(int k=0;k<active_size;k++)

{

G[k] += Q_i[k]*delta_alpha_i +Q_j[k]*delta_alpha_j;

}

part 5

以下是更新 alpha_status 和

G ,ahpha 状态更新较简单，根据 alpha 状态前后是否有变化，适

当更新，更新的内容参考公式G C Q i l

∑ , =1,...,

−

// update alpha_status and G_bar

{

bool ui = is_upper_bound(i);

bool uj = is_upper_bound(j);

update_alpha_status(i); 上海交通大学模式分析与机器智能实验室

update_alpha_status(j);

int k;

if(ui != is_upper_bound(i))//更新alpha_i的影响

{

Q_i = Q.get_Q(i,l);

if(ui)

for(k=0;k<l;k++)

G_bar[k] -= C_i * Q_i[k];

else

for(k=0;k<l;k++)

G_bar[k] += C_i * Q_i[k];

}

if(uj != is_upper_bound(j)) //更新alpha_j的影响

{

Q_j = Q.get_Q(j,l);

if(uj)

for(k=0;k<l;k++)

G_bar[k] -= C_j * Q_j[k];

else

for(k=0;k<l;k++)

G_bar[k] += C_j * Q_j[k];

}

part 6

以下计算目标函数值，因为Gt

Q p t

= ( α + ) ，而目标值为 α α α

T T

Q + p

，故：

// calculate objective value

{

double v = 0;

int i;

for(i=0;i<l;i++)

v += alpha[i] * (G[i] + b[i]);

si->obj = v/2;

}

part 7

回送结果。

// put back the solution

{

for(int i=0;i<l;i++)

alpha_[active_set[i]] = alpha[i];

} 上海交通大学模式分析与机器智能实验室

2.3 类 Solver_NU

class Solver_NU : public Solver

{

public:

Solver_NU() {}

void Solve(int l, const Kernel& Q,const double *b, constschar *y,

double *alpha, double Cp, double Cn, doubleeps,

SolutionInfo* si, intshrinking)

{

this->si = si;

Solver::Solve(l,Q,b,y,alpha,Cp,Cn,eps,si,shrinking);

}

private:

SolutionInfo *si;

intselect_working_set(int &i, int&j);

double calculate_rho();

void do_shrinking();

};

其中函数void Solve()完全调用了Solve::Solve(),this->si = si;一句是因为C++内部变量访问的限制

而添加。

成员函数：

intselect_working_set(int &i, int&j);

选择工作集，参考[1],[4],[5],同时可以参考 Solver::select_working_set。

double calculate_rho();

计算ρ值，参考[1],[4],[5]（对应 libsvm 论文[1]，其实返回值是 b,这可以从后面预测目标值

可以看出。与 Solver::calculate_rho 相比，增加了另外一个返回值，r，该值才是真正的ρ 值。

void do_shrinking();

对样本进行剪裁，参考[1],[4],[5] ,同时可以参考 Solver::do_shrinking()。

2.4 类SVC_Q

class SVC_Q: public Kernel

{

public:

SVC_Q(constsvm_problem& prob,constsvm_parameter& param, constschar *y_)

:Kernel(prob.l, prob.x, param)

{ 上海交通大学模式分析与机器智能实验室

clone(y,y_,prob.l);

cache = newCache(prob.l,(int)(param.cache_size*(1<<20)));

}

Qfloat *get_Q(int i, int len) const

{

Qfloat *data;

intstart;

if((start =cache->get_data(i,&data,len)) < len)

{

for(int j=start;j<len;j++)

data[j] =(Qfloat)(y[i]*y[j]*(this->*kernel_function)(i,j));

}

return data;

}

void swap_index(int i, int j) const

{

cache->swap_index(i,j);

Kernel::swap_index(i,j);

swap(y[i],y[j]);

}

~SVC_Q()

{

delete[ ] y;

delete cache;

}

private:

schar *y;

Cache *cache;

};

说明：

SVC_Q(constsvm_problem& prob,constsvm_parameter& param, constschar *y_)

:Kernel(prob.l, prob.x, param)

该构造函数利用初始化列表Kernel(prob.l, prob.x, param)将样本数据和参数传入(非常简洁)。

get_Q(int i, int len)函数与其他同类相比，在于核函数不同。

swap_index(int i, int j) //交换的东西太多了点

2.5 类 ONE_CLASS_Q

class ONE_CLASS_Q: public Kernel

{ 上海交通大学模式分析与机器智能实验室

public:

ONE_CLASS_Q(constsvm_problem& prob,constsvm_parameter& param)

:Kernel(prob.l, prob.x, param)

{

cache = newCache(prob.l,(int)(param.cache_size*(1<<20)));

}

Qfloat *get_Q(int i, int len) const

{

Qfloat *data;

intstart;

if((start =cache->get_data(i,&data,len)) < len)

{

for(int j=start;j<len;j++)

data[j] =(Qfloat)(this->*kernel_function)(i,j);

}

return data;

}

void swap_index(int i, int j) const

{

cache->swap_index(i,j);

Kernel::swap_index(i,j);

}

~ONE_CLASS_Q()

{

delete cache;

}

private:

Cache *cache;

};

ONE_CLASS_Q 只处理 1 类分类问题(?)，故不保留 y[i]。编号只有 1 类。

get_Q(int i, int len)函数中缺少了y[i],y[j]，这与 One_Class 本身特点有关，只处理一类。

swap_index(int i, int j)少 swap(y[i],y[j]);这句，因为根本没有y[i]可供交换。

2.5 类 SVR_Q

class SVR_Q: public Kernel

{

public:

SVR_Q(constsvm_problem& prob,constsvm_parameter& param)

:Kernel(prob.l, prob.x, param) 上海交通大学模式分析与机器智能实验室

{

//skipped

}

void swap_index(int i, int j) const

{

swap(sign[i],sign[j]);

swap(index[i],index[j]);

}

Qfloat *get_Q(int i, int len) const

{

//skipped

}

~SVR_Q()

{

//skipped

}

private:

int l;

Cache *cache;

schar *sign;

int *index;

mutable int next_buffer;

Qfloat* buffer[2];

};

本类主要是用于做回归，同分类有许多不同之处。参考[1],[5]

//以下的函数全为静态函数，只能在本文件范围内被访问。对照[1]中公式查看。

2.6 函数 solve_c_svc

static void solve_c_svc(constsvm_problem*prob, constsvm_parameter* param,

double *alpha, Solver::SolutionInfo* si,double Cp, double Cn)

在公式α α α

T T

Q + p

中， T

p 为全-1,另外alpha[i]=0,保证α = 0

y 的限制条件，在将来选

择工作集后更新 alpha 时，仍能保证该限制条件。

2.7 函数 solve_nu_svc

static void solve_nu_svc( constsvm_problem*prob, constsvm_parameter *param,

double *alpha, Solver::SolutionInfo* si)

p 为全 0,alpha[i]能保证 α = 0, α = 0

T T

e y .

2.8 函数 solve_one_class 上海交通大学模式分析与机器智能实验室

static voidsolve_one_class(constsvm_problem *prob, constsvm_parameter *param,

double *alpha, Solver::SolutionInfo* si)

限制条件e vl T

α = ，前vl 个 alpha为 1，此后的 alpha全为0，初始条件满足限制条件e vl T

α =

p 为全 0，y为全 1

2.9 函数 solve_epsilon_svr

static voidsolve_epsilon_svr(constsvm_problem *prob, constsvm_parameter *param,

double *alpha, Solver::SolutionInfo* si)

2.10 函数 solve_nu_svr

static void solve_nu_svr( const svm_problem*prob, const svm_parameter *param,

double *alpha, Solver::SolutionInfo* si)

第三节：接口函数、流程

decision_functionsvm_train_one(constsvm_problem *prob, constsvm_parameter *param,

double Cp, double Cn)

训练一组样本集，通常参加训练的样本集只有两类。

程序根据相应的参数，选择所使用的训练或者拟合算法。(这个地方的代码居然如此少)，最后统

计SV和BSV，最后输出决策函数。

void sigmoid_train( int l, const double*dec_values, const double *labels,

double& A, double& B)

LibSVM2.6新增函数

根据预报值来确定 A,B

Af B

≈ˆ

见第 8 节[1],其中 A,B的确定就由本函数确定。

double sigmoid_predict(doubledecision_value, double A, double B)

LibSVM2.6新增函数

可以看看，里面的公式很简单。

void multiclass_probability(int k, double**r, double *p)

LibSVM2.6新增函数

(好像比较复杂哦☺ )

voidsvm_binary_svc_probability(constsvm_problem *prob, constsvm_parameter *param,

double Cp, double Cn, double& probA,double& probB)

LibSVM2.6新增函数上海交通大学模式分析与机器智能实验室

先做交叉验证，然后用决策值来做概率估计。需要调用 sigmoid_train 函数。

double svm_svr_probability(constsvm_problem *prob, constsvm_parameter *param)

LibSVM2.6新增函数

先做交叉验证，然后函数经过计算后，输出概率值。

svm_model *svm_train(constsvm_problem*prob, constsvm_parameter *param)

根据选择的算法，来组织参加训练的分样本，以及进行训练结果的保存。其中会对样本进行初步

的统计。

一、分类部分：

→统计类别总数,同时记录类别的标号，统计每个类的样本数目

→将属于相同类的样本分组，连续存放

→计算权重C

→训练n(n-1)/2个模型

→初始化nozero数组，便于统计SV

→//初始化概率数组

→训练过程中，需要重建子数据集，样本的特征不变，但样本的类别要改为+1/-1

→//如果有必要，先调用svm_binary_svc_probability

→训练子数据集svm_train_one

→统计一下nozero,如果nozero已经是真，就不变，如果为假，则改为真

→输出模型

→主要是填充svm_model,

→清除内存

二、回归部分：

→类别数固定为2

→//选择性地做svm_svr_probability, one-class不做概率估计

→训练

→输出模型

→清除内存

训练过程函数调用：

svm_train→svm_train_one→solve_c_svc(foxexample)→

→Solvers;//这里调用构造函数，但啥也没有做。

→s.Solve(l, SVC_Q(*prob,*param,y), minus_ones, y, alpha, Cp, Cn,param->eps, si,

param->shrinking);

→调用SVC_Q(Kernel) 类的构造函数，同时也会调用Kernel类的构造函数。在SVC_Q

类的构造函数中复制目标值(y),同时申请内存，此时激发Cache类,申请内存，构造双向列表等。

→Solve函数做完其他部分工作，主要是算法的实现。

void svm_cross_validation(constsvm_problem*prob, constsvm_parameter *param, int nr_fold,

double *target)

LibSVM2.6新增函数,LibSVM2.5中为示例函数。上海交通大学模式分析与机器智能实验室

先随机打乱次序，然后根据n折的数目，留一份作为测试集，其他的作为训练集，做n次。

随机打乱次序使用的非标准的扑克洗牌的算法。(LibSVM2.5里面随机排序的结果很乱)

For example:

样本集被分为10份；第一次，将样本集的第2～10部分作为整体进行训练，得到一个模型，然后

对样本集的第1部分进行预报，得到一个精度；第二次，将样本集的第1，3～10作为整体训练，

对第二部分进行预报，得到又一个精度，…。最后对10个精度做一下处理（方法很多，不逐一列

出）。

intsvm_get_nr_class(constsvm_model *model)

获得样本类别数；本函数为典型的马后炮。

void svm_get_labels(constsvm_model *model,int* label)

某类样本的标号（样本并不按编号排列，通过标号，可以循序访问样本集）。

doublesvm_get_svr_probability(constsvm_model *model)

访问训练好的模型中的概率值。

void svm_predict_values(constsvm_model*model, constsvm_node *x, double* dec_values)

预测样本数据目标值；

如果是做分类问题，返回一大堆值，供后续的函数做决策；如果是回归问题，返回一个值。

其中 one-v-one 方法需要做 n(n-1)/2 次，产生 n(n-1)/2 个预报值。

double svm_predict(constsvm_model *model,constsvm_node *x)

预测，分类问题主要使用了One-to-One方法组织n*(n-1)/2种方法。

如果是分类问题，对预测的 n*(n-1)/2 个值，做投票处理，票数最高的是预报的类。

如果是 One-Class,根据预报值的符号，返回+1/-1

如果是回归问题，直接返回该 double 类型的值。

double svm_predict_probability(

constsvm_model *model, constsvm_node *x,double *prob_estimates)

LibSVM2.6 新增函数

跳过。

intsvm_save_model(const char*model_file_name, constsvm_model *model)

svm_model *svm_load_model(const char*model_file_name)

void svm_destroy_model(svm_model* model)

以上 3 个函数均为 LibSVM2.5 示例程序中的函数，现成为 LibSVM2.6 的一部分。

看看名字就知道是干什么的了，不介绍了。

void svm_destroy_param(svm_parameter*param)

LibSVM2.6 新增函数

释放权重系数数组的内存。

//检查数据上海交通大学模式分析与机器智能实验室

const char*svm_check_parameter(conststructsvm_problem *prob, conststructsvm_parameter

*param);

该段代码检查参数的合理性。凡对 LibSVM进行增加 SVC类型和核函数，都必须修改该文件。

LibSVM2.5 在该部分代码会存在内存泄漏，LibSVM2.6中已经修正。

其中需要注意的是，nu 的取值的范围，

nMax nMin

nMin

其中 nMax 为样本数最多的类的样本数，nMin 为样本数最少的类的样本。

intsvm_check_probability_model(constsvm_model*model)

LibSVM2.6 新增函数

检查概率模型，主要是检查一些限制条件。

Margin

Figure 1: SVM separation of two dataclasses - SV points circled.

Class 2

Class 3

Class 1

f1(x)

f2(x)

f3(x)

Figure 2: One-against-rest SVM separationof three data classes 上海交通大学模式分析与机器智能实验室

Class 2

Class 3

Class 1

f1,3(x)

f1,2(x)

f2,3(x)

Figure 3: One-against-one SVM separation ofthree data classes

1V4

2V4 1V3

3V4 2V3 1V2

Not 1 Not 4

Not 4 Not 1

Not 3 Not 2

4 3 2 1

Figure 4: Decision DAG SVM

其他：

一、One-v-Rest多类方法

http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/1vsall/

二、DDAG 多类方法

http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/libsvm-2.3dag.zip上海交通大学模式分析与机器智能实验室

参考文献：

[1]Chih-Chung Chang and Chih-Jen Lin, LIBSVM :a library for support vector machines, 2001.

Software available athttp://www.csie.ntu.edu.tw/~cjlin/libsvm

[2]J. Platt. Fast training of supportvector machines using sequential minimal

optimization. In B. Scholkopf, C. Burges,and A. Smola, editors, Advances in

kernel methods: support vector learning.MIT Press, 1998.

[3] Sequential Minimal Optimization for SVM

http://www.datalab.uci.edu/people/xge/svm/smo.pdf

[4]Chang, C.-C. and C.-J. Lin (2001).Training ν _-support vector classifiers: Theory and

algorithms. Neural Computation 13 (9),2119–2147.

[5]Chang, C.-C. and C.-J. Lin (2002).Training ν _support vector regression: Theory and

algorithms. Neural Computation 14 (8),1959–1977.

你可能感兴趣的:(代码,注释,libsvm)

element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
ARM中断处理过程落汤老狗嵌入式linux
一、前言本文主要以ARM体系结构下的中断处理为例，讲述整个中断处理过程中的硬件行为和软件动作。具体整个处理过程分成三个步骤来描述：1、第二章描述了中断处理的准备过程2、第三章描述了当发生中的时候，ARM硬件的行为3、第四章描述了ARM的中断进入过程4、第五章描述了ARM的中断退出过程本文涉及的代码来自3.14内核。另外，本文注意描述ARM指令集的内容，有些sourcecode为了简短一些，删除了T
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
在Ubuntu中编译含有JSON的文件出现报错芝麻糊76 Linux kill_bug linux ubuntu json
在ubuntu中进行JSON相关学习的时候，我发现了一些小问题，决定与大家进行分享，减少踩坑时候出现不必要的时间耗费截取部分含有JSON部分的代码进行展示char*str="{\"title\":\"JSONExample\",\"author\":{\"name\":\"JohnDoe\",\"age\":35,\"isVerified\":true},\"tags\":[\"json\",\"
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
ios GCD _Waiting_
1.GCD任务和队列学习GCD之前，先来了解GCD中两个核心概念：任务和队列。任务：就是执行操作的意思，换句话说就是你在线程中执行的那段代码。在GCD中是放在block中的。执行任务有两种方式：同步执行（sync）和异步执行（async）。两者的主要区别是：是否等待队列的任务执行结束，以及是否具备开启新线程的能力。同步执行（sync）：同步添加任务到指定的队列中，在添加的任务执行结束之前，会一直等
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
「豆包Marscode体验官」 | 云端 IDE 启动 & Rust 体验张风捷特烈 ide rust 开发语言后端
theme:cyanosis我正在参加「豆包MarsCode初体验」征文活动MarsCode可以看作一个运行在服务端的远程VSCode开发环境。对于我这种想要学习体验某些语言，但不想在电脑里装环境的人来说非常友好。本文就来介绍一下在MarsCode里，我的体验rust开发体验。一、MarsCode是什么它的本质是:提供代码助手和云端IDE服务的web网站，可通过下面的链接访问https://www
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round