rushshi

从感知机(Perceptron)到支持向量机(SVM)

duality chapter有错误，待修订

本文会介绍感知机和支持向量机的原理，着重阐述这两个算法中的一些逻辑推导思路。

1.基础知识：函数距离(functional margins)和几何距离(geometrical margins)

假设 x∈Rn ，那么显然 wTx+b=0 是一个超平面。通过推导，空间中的任意一点 x(i) 到这个超平面的距离为

L = w T x ( i ) + b | | w | |

假设我们有样本点 A(x(i),y(i)),y(i)∈{1,−1} ,

我们定义几何距离(geometrical margins)为

γ (i) = y (i) (w T x ( i ) + b | | w | |)

接着我们定义函数距离(functional margins)为

γ^(i) = y (i) (w T x (i) + b)

这两个距离有什么特征呢？
① 函数距离可以表示分类的正确性和确信度：当

wTx(i)+b>0 时，说明样本A在超平面的上方，也就属于1类（记上图圆点为-1，叉点为1），如果此时

y(i) =1,那么A样本分类正确，

γ^(i)>0 ；否则

γ^(i)<0 。
② 同倍数扩大或缩小w、b，超平面是不变的，函数距离会同等增减；而几何距离不变，因为点到固定平面的距离是不变的。
③

γ^(i)=γ^∗||w||

那这些特性有什么用呢？其实它们在感知计算法中起着重要作用

2.感知机(Perceptron)

利用特性①，我们可以判断样本点是否分类正确，最终画出一个超平面能把线性可分的数据正确分类（注意是线性可分的训练数据）；利用特性②，我们可以用误分类样本点的几何距离之和来表示模型的损失函数。
1、具体地，对于误分类点来说， −y(i)(wTx(i)+b)>0 ，所以所有误分类点到超平面的总距离是

- 1 | | w | | \sum x (i) \in M y (i) (w T x (i) + b)

M为误分类的集合。这里我们可以直接省略

1||w|| ，就得到感知机学习的损失函数

L(w,b)=−∑x(i)∈My(i)(wTx(i)+b) 。
为什么可以直接省略

1||w|| ?
（1）.因为感知机模型是以误分类点为驱动的，最后损失函数的值必然为零，即无误分类点。所以根据特性①，既然函数距离能判断样本点的分类正确性，我们何必用几何距离呢？实际上我们并不关心lost function具体数值的变化，我们只在乎还有没有误分类点。
（2）.去掉

1||w|| ，我们得到的lost function是关于w,b的连续可导线性函数，可以用梯度下降法轻松地进行优化。

2、利用随机梯度下降法SGD，损失函数的梯度为

\nabla w L (w, b) = - \sum x (i) \in M y (i) x (i) \nabla b L (w, b) = - \sum x (i) \in M y (i)

随机选取一误分类点，对w,b进行更新：

w \leftarrow w + η y (i) x (i) b \leftarrow b + η y (i)

3、算法：
给定数据集T，学习率 η
（1）选取初值 w0,b0
（2）根据函数距离选取误分类点
（3）更新 w,b
（4）转至（2），直至没有误分类点

4、可证明对于线性可分数据集，感知机算法是收敛的，具体见《统计学习方法》。

3.支持向量机(SVM)

3.1.从感知机(Perceptron)到支持向量机(SVM)

感知机学习算法会因采用的初值不同而得到不同的超平面。而SVM试图寻找一个最佳的超平面来划分数据，怎么算最佳呢？我们自然会想到用最中间的超平面就是最好的。如下图

显然在SVM中我们不能在使用函数距离 γ^(i) 来作为损失函数了，当我们试图使上图虚线之间的”gap”，最大自然要用几何距离。
我们定义

γ = min i = 1, . . ., m γ (i)

,那么一个最优间距分类器可以写成

max γ, w, b s . t . γ y (i) (w T x ( i ) + b | | w | |) ⩾ γ, i = 1, . . ., m

通过最大化

γ 就可以找到最大的gap。
根据特性③，我们可以将上面的优化问题转化为

max γ, w, b s . t . γ ^ | | w | | y (i) (w T x (i) + b) ⩾ γ^, i = 1, . . ., m

可是这个优化问题并不容易求解，我们期望目标函数是一个凸函数，这样优化起来就比较方便了。
这时注意到函数距离的特性②，我们可以直接让

γ^=1 。Why?假设我们这个优化问题的最优解是

wopt，bopt ，那么我们可以总是可以同倍数地调整

wopt，bopt 使得

γ^=1 ，而此时最优超平面是不变的，所以上面的优化问题可以化成

max γ, w, b s . t . 1 | | w | | ⟺ min γ, w, b 1 2 | | w | | 2 y (i) (w T x (i) + b) ⩾ 1, i = 1, . . ., m

这样SVM模型就转化为了一个二次规划问题（Quadratic Programming）。此时我们可以用matlab的一些工具来处理这个优化问题了，可是一旦数据量变大，计算就会变得很缓慢。所以我们此时把这个优化问题转化为一个拉格朗日对偶问题，此时不仅能简化计算，更能引入SVM中最重要的kernel概念。啥是拉格朗日对偶问题？为什么能简化计算？什么是kernel？为什么能引入kernel？好吧，我承认问题有很多，不过让我们一一来窥探。

3.2. Lagrange Duality

首先来看看wiki上对Lagrange Multipler和Lagrange Duality的说明
Lagrange Multipler：In mathematical optimization, the method of Lagrange multipliers is a strategy for finding the local maxima and minima of a function subject to equality constraints.

1.对于最简单的只有等式约束的规划问题，例如：

min s . t . f (x, y) g (x, y) = c

这个优化问题可以粗略地用函数等高线图来表示

我们的目标就是要找到一点相切点 (x0,y0) ，使得 f(x,y) 达到最小值，因为梯度和等高线图是垂直的，所以 f(x,y)和g(x,y) 在点 (x0,y0) 上的梯度是平行的，此时， ∇x,yf=−λ∇x,yg ，其中 ∇x,yf=(∂f∂x,∂f∂y) ， ∇x,yg=(∂g∂x,∂g∂y) ， −λ 就是两个向量的平行参数。
我们可以引入一个拉格朗日乘子 λ 得到Lagrange Function

L (x, y, λ) = f (x, y) + λ (g (x, y) - c)

那么令

∇x,yL=0 就是平行条件，

∇λL=0 就是原始问题的等式约束，这样就把原问题放到一个Lagrange Function中求解。

2.对于更一般的优化问题的原始问题，会有不等式约束例如：

min s . t . f 0 (x), x \in R n f i (x) ⩽ 0, i = 1, . . ., m h j (x) = 0, j = 1, . . ., p (1) (2)

原问题的定义域：

D=(∩mi=0domfi)∩(∩pj=1domhj)
可行点（feasible）：

x∈D ，且满足约束条件。
可行域：所有可行点的集合F。
最优化值：

p∗=inf{f0(x)|fi(x)⩽0,hj(x)=0} （求下确界inf和求最小值min在这里是等价的）
注意定义域和可行域的差别：定义域和约束条件无关，一般来说定义域大于可行域。

步骤1：定义一个Lagrange函数为

L (x, λ, ν) = f 0 (x) + \sum i = 1 m λ i f i (x) + \sum j = 1 p ν j h j (x) s . t . λ i ⩾ 0 (3)

假设对L函数在 x∈D 上逐点求下确界（参考boyd的《convex optimization》）的函数是

g (λ, ν) = inf x \in D L (x, λ, ν)

这里的

g(λ,ν) 就是我们常说的 对偶函数（dual function），很明显它是一个关于

λ，ν 的线性函数。

如果我们把原问题的约束条件 (fi(x)⩽0，hj(x)=0) 代入Lagrange function,那么对于原问题中可行域F中的任意可行点 x˜ 有

\sum i = 1 m λ i f i (x ˜) + \sum j = 1 p ν j h j (x ˜) ⩽ 0

这个不等式可以推导出两个结果：
① 因为L函数后两项小于等于0，所以，

maxλ,νL(x,λ,ν)=f0(x) （注：这里的

f0(x) 是关于x的函数），进而

min x max λ, ν L (x, λ, ν) = p *

我们称这个式子为对偶问题中的Primal Problem

② 因为L函数后两项小于等于0，所以

L (x ˜, λ, ν) = f 0 (x ˜) + \sum i = 1 m λ i f i (x ˜) + \sum j = 1 p ν j h j (x ˜) ⩽ f 0 (x ˜)

（注：这里的

f0(x˜) 是一个具体的值）
根据下确界的性质：一系列函数逐点下确界必然小于等于这一系列函数，有

g (λ, ν) = inf x \in D L (x, λ, ν) ⩽ L (x ˜, λ, ν) ⩽ f 0 (x ˜)

因为

x˜ 是可行域F中的任意值，所以

⟹ ⟹ g (λ, ν) ⩽ min f 0 (x ˜) g (λ, ν) ⩽ p * max λ, ν g (λ, ν) ⩽ p *

记 dual problem 的最优值为

d∗ 的话，根据上面的推导，我们就得到了如下性质：

d * = max λ, ν min x L (x, λ, ν) ⩽ min x max λ, ν L (x, λ, ν) = p *

步骤2：图形解释
如果上面公式没有理解，我们可以通过画图来理解一下拉格朗日对偶性。
我们还是把原问题的约束条件代入Lagrange function，为了简化图像，我们假设L只有一个不等式约束 f1(x) 且没有等式约束，原问题的函数图像大致如下：

解释：最上面这条是原函数 f0(x) ，最下面的虚线是约束函数 f1(x) ，中间的这10条虚线分别是 λ=0.1,0.2,...,1 时，L函数的图像。在图中我们还可以看到，定义域D至少是[-1,1]（图像没画完整），可行点集合F为[-0.46,0.46]

那么根据上图我们可以画出右侧 g(λ) 的图像：

解释：因为 g(λ,ν) 是在 x∈D 上求下确界的，所以我们要考虑定义域D[-1,1]上L的最小值。 g(λ) 的图像上的那条虚线其实是原问题的最优解 p∗=f0(−0.46)=1.54 。

可以看到 maxg(λ) 是小于最优解 p∗ 的，约束条件 f1(x) 在这里的作用是保证 g(λ) 的下降。

步骤3：
通过数学分析和图形解释，我们都可以看到dual problem和primal problem的关系，即

d * = max λ, ν min x L (x, λ, ν) ⩽ min x max λ, ν L (x, λ, ν) = p *

如果我们能让这个式子取等号，那们我们就成功地在原来约束条件下把primal problem转化为了求解dual problem。

通常我们把 d∗⩽p∗ 的情况叫做weak duality， d∗=p∗ 的情况叫做strong duality， p∗−d∗ 被称作duality gap。需要注意的是，无论 primal problem是什么形式，dual function总是凹的（因为它是关于 λ,ν 的线性函数），dual problem总是一个 convex optimization 的问题——它的极值是唯一的（如果存在的话）。
与原始问题的最优解相比，dual function多了后面

\sum i = 1 m λ i f i (x) + \sum j = 1 p ν j h j (x)

这两项。我们只要能让这两项等于零，那么就有

d∗=p∗ 了！所以在已有约束条件(1)(2)(3)下，我们最想看到的取等条件就是

\sum i = 1 m λ i f i (x *) = 0 (4)

这个就是对偶互补条件 complementary slackness：从形式上看，当

λi>0 时，必须有

fi(x)=0 ；当

fi(x)<0 时，必须有

λi=0 。这就是说，当对偶问题的约束条件不起作用时，原问题的约束条件必须要起作用，反之亦然，或者说，只有原问题的起作用的约束才对应着非零的对偶变量。
然后根据前面的lagrange乘子法，我们要

maxλ,νminxL(x,λ,ν) ，就要

\nabla f 0 (x *) + \sum i = 1 m λ i \nabla f i (x *) + \sum j = 1 p ν j \nabla h j (x *) = 0 (5)

至此，我们得到了著名的Karush–Kuhn–Tucker (KKT) conditions：如果函数

fi(x) 是凸函数且可微，

hj(x) 是仿射函数，当满足(1)，(2)，(3)，(4)，(5)时，

d∗=p∗ 。
其证明比较简单，见pluskid的blog。这里的对偶问题我感觉我讲的很晦涩，pluskid的比较清楚详细，我主要引入一些优化理论中的结论。

步骤4（将lagrange duality应用到svm中）：
① svm的最初优化问题：

min γ, w, b s . t . 1 2 | | w | | 2 y (i) (w T x (i) + b) ⩾ 1, i = 1, . . ., m

②lagrange function：

L (w, b, α) = 1 2 | | w | | 2 - \sum i = 1 m α i [y (i) (w T x (i) + b) - 1]

primal problem:

min w, b max α L (w, b, α)

假设

d∗ 是最优解。
③dual problem：

max α min w, b L (w, b, α)

假设

p∗ 是最优解。

只要kkt条件成立，即：

\nabla w L (w *, b *, α *) = w * - \sum i = 1 m α * i y (i) x (i) = 0 \nabla b L (w *, b *, α *) = - \sum i = 1 m α * i y (i) = 0 α * i [y (i) (w * x (i) + b *) - 1] = 0, i = 1, 2, \cdot \cdot \cdot, N y (i) (w * x (i) + b *) - 1 ⩾ 0, i = 1, 2, \cdot \cdot \cdot, N α * i ⩾ 0, i = 1, 2, \cdot \cdot \cdot, N (6) (7) (8) (9) (10)

就能使

w∗,b∗ 是原始问题的驻点，

α∗ 是对偶问题的驻点，且

d∗=p∗ 。

步骤5：
最后我们来看看wiki上对拉格朗日对偶性的解释
Lagrange Duality：In mathematical optimization theory, duality means that optimization problems may be viewed from either of two perspectives, the primal problem or the dual problem (the duality principle). The solution to the dual problem provides a lower bound to the solution of the primal (minimization) problem. However in general the optimal values of the primal and dual problems need not be equal. Their difference is called the duality gap. For convex optimization problems, the duality gap is zero under a constraint qualification condition. Thus, a solution to the dual problem provides a bound on the value of the solution to the primal problem; when the problem is convex and satisfies a constraint qualification, then the value of an optimal solution of the primal problem is given by the dual problem.

这里我加粗了一些名词和句子，这些都是拉格朗日对偶性的重要性质。

3.2. 支持向量机（SVM）基础

根据complementary slackness，当 αi>0 时， y(i)(w∗x(i)+b∗)−1=0 ，即样本i与超平面的函数距离为1，也就是最近点。

虚线上的三个点就称为支持向量（support vectors）。

回顾KKT条件：
在问题中我们已经满足了条件（9）（10），然后我们依次来看剩余的条件。
根据（6）有

w * = \sum i = 1 m α * i y (i) x (i)

那么把w和（7）代回L中有

L (w, b, α) = 1 2 | | w | | 2 - \sum i = 1 m α i [y (i) (w T x (i) + b) - 1] = 1 2 w T w - \sum i = 1 m α i y (i) w T x (i) - \sum i = 1 m α i y (i) b + \sum i = 1 m α i = w T (1 2 w - \sum i = 1 m α i y (i) x (i)) + \sum i = 1 m α i = - 1 2 w T \sum i = 1 m α i y (i) x (i) + \sum i = 1 m α i = - 1 2 (\sum i = 1 m α i y (i) x (i)) T \sum i = 1 m α i y (i) x (i) + \sum i = 1 m α i = - 1 2 \sum i = 1 m α i y (i) (x (i)) T \sum i = 1 m α i y (i) x (i) + \sum i = 1 m α i = - 1 2 \sum i, j = 1 m α i y (i) (x (i)) T α j y (j) x (j) + \sum i = 1 m α i = \sum i = 1 m α i - 1 2 \sum i, j = 1 m α i α j y (i) y (j) (x (i) \cdot x (j))

这时我们通过kkt条件消去了

maxαminw,bL(w,b,α) 中的

w,b 。
最终将primal problem化为了求解

max α s . t . \sum i = 1 m α i - 1 2 \sum i, j = 1 m α i α j y (i) y (j) (x (i) \cdot x (j)) α i ⩾ 0, i = 1, . . ., m \sum i = 1 m α i y (i) = 0,

可以看到对偶之后的约束条件比原来的约束条件简单了很多，简化了计算，之后我们用SMO算法求解这个优化问题的时候也可以见其方便性。
当我们求出

α∗i 之后，就可以得到

w * = \sum i = 1 m α * i y (i) x (i)

那么b的取值必然是两个离决策面最近的异类样本（支持向量）的中点，即

b * = - max i : y ( i ) = - 1 w * x ( i ) + min i : y ( i ) = 1 w * x ( i ) 2

这里b需要对任意样本满足对偶互补条件（8）。
于是得到了最终的决策面

w T x + b = \sum i = 1 m α * i y (i) (x (i) \cdot x) + b *

至此我们通过了所有KKT条件的要求，得到了最终决策面。其实对偶互补条件会在我们使用SMO算法计算的时候来也要作为一个更新约束的（后文的更新b规则），所以对偶互补条件是作为最后一道关卡的。Cool！

3.3. 核技巧（kernels）：处理非线性数据

当数据是线性可分时，我们可以直接采用上面得到的线性SVM模型，可是当数据不可分时，我们要非线性SVM模型。
从Linear regression可以联想到，如果要处理线性不可分的情况，样本特征函数除了原始特征 x1,x2,...,xn ，我们还要引入一些特殊项，比如 x21,x31,x1x2等，我们的特征函数为

ϕ (x) = ⎡ ⎣ ⎢ x 21 x 31 x 1 x 2 ⎤ ⎦ ⎥

之前我们通过对偶化把原问题写成了x的内积形式

(x(i)⋅x) ，所以特征函数变化之后，我们可以直接代入

(ϕ(x(i))⋅ϕ(x)) ，这就是我们的Kernel：

K (x (i), x) = ϕ (x (i)) T ϕ (x)

通过Kernel就可以处理非线性函数了，不过这里有个问题，如果原始特征是2维，那通过特征组合加上常数项，

ϕ(x) 就有6维；原始特征是3维的话，

ϕ(x) 就有20维。这个数目是呈爆炸性增长的，而且如果遇到无穷维的情况，就根本无从计算了。
不过如果kernel是这样的话，且x原始特征有3维：

K (x, z) = (x T z + c) 2 = (x T z) 2 + 2 c x T z + c 2 = (\sum i = 1 n x i z i) (\sum j = 1 n x j z j) + 2 c \sum i = 1 n x i z i + c 2 = \sum i = 1 n \sum j = 1 n x i z i x j z j + 2 c \sum i = 1 n x i z i + c 2 = \sum i, j = 1 n (x i x j) (z i z j) + \sum i = 1 n (2 c - - \sqrt x i) (2 c - - \sqrt z i) + c 2

惊奇的发现就这么一个平方式就把

(x⋅z) 算好了，而且此时的

ϕ(x) 就是

∑ni,j=1xixj，∑ni=12c−−√xi,c 的组合：

ϕ (x) = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ x 21 x 22 x 23 x 1 x 2 x 1 x 3 x 2 x 3 2 c - - \sqrt x 1 2 c - - \sqrt x 2 2 c - - \sqrt x 3 c ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥

（注意：这里只是两个特征之间的组合，如果3个特征组合的话，那

K(x,z)=(xTz+c)3 ，这样可以得到20维的

ϕ ）

核函数通过巧妙的计算，把高维 ϕ(x) 的计算转化成了低维原始空间的计算，大大降低计算复杂度，实现了线性不可分数据的分割。

常用的几个核函数：
多项式核 K(x,z)=(xTz+c)d ：显然刚才我们举的例子是这里多项式核的一个特例（R = c，d = 2）。这个核所对应的特征空间 ϕ(x) 的维度是 Cdn+d ，n是原始空间的维度。
高斯核 K(x,z)=exp(−||x−z||22σ2) ，将高斯核泰勒展开为

exp (- | | x - z | | 2 2 σ 2) = \sum n = 0 \infty 1 n ! (- 1 2 σ 2) n (| | x - z | | 2) n

这个核会将原始空间映射为无穷维空间。从展开式中可见，如果

σ 选得很大的话，高次特征上的权重实际上衰减得非常快，所以实际上（数值上近似一下）相当于一个低维的子空间；反过来，如果选得很小，则可以将任意的数据映射为线性可分——当然，这并不一定是好事，因为随之而来的可能是非常严重的过拟合问题。不过，总的来说，通过调控参数，高斯核实际上具有相当高的灵活性，也是使用最广泛的核函数之一。
线性核 K(x,z)=(x⋅z) ，这实际上就是原始空间中的内积。这个核存在的主要目的是使得“映射后空间中的问题”和“映射前空间中的问题”两者在形式上统一起来了(意思是说，咱们有的时候，写代码，或写公式的时候，只要写个模板或通用表达式，然后再代入不同的核，便可以了，于此，便在形式上统一了起来，不用再分别写一个线性的，和一个非线性的)。

当然不是每个函数都可以作为核函数的，关于kernel的有效性可以参考mercer定理。

3.4. svm的泛化能力：正则化处理

右图只因为一个数据（这种异常数据称作outlier）而大幅度地改变了分割平面，这是我们不想看到的；当使用kernel处理线性不可分数据时，我们没法保证处理之后就一定是线性可分的。
基于以上两点不足之处，我们把SVM模型改为

min γ, w, b s . t . 1 2 | | w | | 2 + C \sum i = 1 m ξ i y (i) (w T x (i) + b) ⩾ 1 - ξ i, i = 1, . . ., m ξ i ⩾ 0, i = 1, . . ., m .

其中

ξ 称为松弛变量 (slack variable) ，对应数据点允许偏离的 functional margin 的量。当然，如果我们运行

ξ 任意大的话，那任意的超平面都是符合条件的了。所以，我们在原来的目标函数后面加上一项，使得这些的总和也要最小，这样就做到了相互制约。其中

C 是一个参数，用于控制目标函数中两项（“寻找 margin 最大的超平面”和“保证数据点偏差量最小”）之间的权重。注意，其中

ξ 是需要优化的变量（之一），而

C 是一个事先确定好的常量。

优化后模型的拉格朗日函数：

L (w, b, ξ, α, β) = 1 2 | | w | | 2 + C \sum i = 1 m ξ i - \sum i = 1 m α i [y (i) (w T x (i) + b) - 1 + ξ i] - \sum i = 1 m β i ξ i

通过 ∇w,b,ξ=0 得到对偶问题就是：

max α s . t . \sum i = 1 m α i - 1 2 \sum i, j = 1 m α i α j y (i) y (j) (x (i) \cdot x (j)) 0 ⩽ α i ⩽ C, i = 1, . . ., m \sum i = 1 m α i y (i) = 0,

根据KKT的对偶互补条件

\sum i = 1 m α i [y (i) (w T x (i) + b) - 1 + ξ i] = \sum i = 1 m β i ξ i = 0

和

\nabla ξ i = C - α i - β i = 0

得

α i = 0 \Rightarrow ξ i = 0 \Rightarrow y (i) (w T x (i) + b) ⩾ 1 α i = C \Rightarrow ξ i ⩾ 0 \Rightarrow y (i) (w T x (i) + b) ⩽ 1 0 < α i < C \Rightarrow ξ i = 0 \Rightarrow y (i) (w T x (i) + b) = 1

以上给出了不同数值的lagrange乘子

αi 所对应于的样本与决策面之间的位置关系。由于决策面

∑mi=1αiy(i)k(x(i),x)+b=0 是由非零

αi 的样本确定的，因此我们把

αi>0 的样本称为支持向量。其中

0<αi<C 时，样本与决策面的函数距离为1；

αi=C 时，样本就是outliers。

3.4. SMO优化算法（Sequential minimal optimization）

SMO算法由Microsoft Research的John C. Platt在1998年提出，并成为最快的二次规划优化算法，特别针对线性SVM和数据稀疏时性能更优。关于SMO最好的资料就是他本人写的《Sequential Minimal Optimization A Fast Algorithm for Training Support Vector Machines》了。
SMO算法的核心思想就是分治法，把大问题化成一个个小问题。
SMO的主要步骤如下：

意思是，第一步选取一对 αi 和 αj ，选取方法使用启发式方法（后面讲）。第二步，固定除 αi 和 αj 之外的其他参数，然后就变成了二元优化问题，可以直接用换元法求解。不断重复，直到优化函数收敛。

首先把原问题变成最小化形式是

min α s . t . W (α i) = 1 2 \sum i, j = 1 m α i α j y (i) y (j) (x (i) \cdot x (j)) - \sum i = 1 m α i 0 ⩽ α i ⩽ C, i = 1, . . ., m \sum i = 1 m α i y (i) = 0,

接下来就来野生推导smo了：

(一) 确定 α1 和 α2 的范围

假设选取变量 α1 和 α2 ，固定其他 αi ，根据 ∑mi=1αiy(i)=0 有

α 1 y (1) + α 2 y (2) = - \sum i = 3 m α i y (i) = ς

ς 是常数。
①当样本1，2异类，即一个为1，一个为-1，函数

α1y(1)+α2y(2)=ς 的图像如下：

可以看出更新后的

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方