魏之燕

支持向量机原理及求解 SVM Slater条件 KKT条件 SMO算法软间隔

支持向量机SVM原理及求解过程介绍

支持向量机（Support Vector Machine, 简称SVM），又称为Sparse Kernel Machine或Maximum Margin Classifier，是一类经典的机器学习方法，它融合了之前已有的计算学习方法、线性判别函数和优化方法，常用于分类、回归和异常检测任务，在解决小样本问题、非线性学习和高维模式识别中有特别的优势。20世纪60年代，SVM算法的前身由俄国科学家Vapnik和Chervonenkis建立起来，到了90年代，美国科学家Corinna Cortes和Vapnik提出了基于软间隔的标准SVM算法。在深度学习兴起之前SVM有着广泛的应用和影响，至今它仍是重要的分类器和学习算法之一。本文我们将重点介绍经典SVM的求解目标和优化方法。

文章目录

支持向量机SVM原理及求解过程介绍

最大间隔超平面
拉格朗日乘子法，对偶问题与KKT条件
异常点，软间隔与核函数引入
SMO算法求解
SVM小结

最大间隔超平面

在机器学习中，样本经常由一系列特征来进行描述，这些特征数据构成一个向量，也构成欧式空间中的一个样本点，多个样本就可以看做欧式空间中分布的多个样本点。如果研究的是分类任务，这些样本点还经常具有类别标签信息。经典SVM研究的是二分类问题，假设现有训练集D，其中包含两类线性可分的样本，共n个：
$D={(x_1,y_1 ),(x_2,y_2 ),…,(x_n,y_n)} \\ x_i=(d_{1i},d_{2i},…d_{mi} )^T,y_i=±1$
这里 $x_i$ 表示第 $i$ 个样本对应的特征向量， $m$ 为特征维度， $d_{ji}$ 表示样本 $x_i$ 的第 $j$ 个特征对应的值。 $y_i$ 表示第i个样本的标签，取值为 $1$ 或 $- 1$ ，分别表示正类或负类。在这 $n$ 个样本点分布的欧式空间中，因为样本点是线性可分的，所以可能存在多个超平面 $w^T x+b=0$ 可以将这些点分隔开来，其中 $w=(w_1,w_2,…w_m )^T$ ,表示超平面的法向量，长度与样本特征维度相同为 $m$ ， $b$ 是位移项。我们所说的超平面在二维空间中是直线，在三维空间中是平面，在更高维空间中就是抽象的超平面。

图1 可能存在的分割超平面

在图1中，为了简化并说明问题我们这里认为 $m = 2$ ， $d_1,d_2$ 表示两个特征维度，对于任意样本点 $x_i$ ，可以根据在这两个特征维度上的值 $d_{1i}$ , $d_{2i}$ 寻找到其在上图的二维欧式空间中对应的位置，并根据所属类别分别用 $+$ 或 $-$ 标示出来。可以看到，上图中存在多个超平面可以将这两类点分隔开来。
在二分类任务中，我们只需要找到任意一个这样的超平面，就可以成功将两类样本分开了，对于一个新样本，只需要判断它在超平面上方还是下方就可以预测其类别了。但是SVM认为随意一个超平面还不够，它希望找到一个最鲁棒最优秀的超平面，这个选择标准就是：能正确划分训练集并且几何间隔最大。所谓几何间隔最大，就是说如果从超平面两边分别选取一个距离超平面最近的点，则距离之和应该最大。SVM认为这样的超平面最鲁棒。接下来我们讲如何确定这个距离之和最大的超平面。

图2 最佳超平面的选择

如图2所示，假设超平面上方 $x$ 的点均为正类即 $y = + 1$ ，且满足 $w^T x+b>0$ ；超平面下方的点均为负类即 $y = - 1$ ，且满足 $w^T x+b<0$ 。然后进一步加入“间隔”概念，令
$f(x)=\left\{ \begin{aligned} (w^T x+b≥+1, & if y=+1 \\ w^T x+b≤-1, & if y=-1 \end{aligned} \right.$

也就是说我们在 $w^T x+b=0$ 这个超平面之外，还找到了对应的 $w^T x+b=±1$ 这两个超平面，两类的距离 $w^T x+b=0$ 最近的点不可以越过 $w^T x+b=±1$ ，最次也要恰好分布在这两个超平面上。这是一个更严格的约束，我们首先假设这样的超平面是存在的。
这样的话所有的点就都满足 $y(w^T x+b)≥1$ 。一个超平面的表达式可以有无数种，我们只选择满足以上描述的那一种就好了。恰好位于 $w^T x+b=±1$ 上的点使得等号成立，称为“支持向量”，其他的点使得大于号成立。我们知道， $D$ 中任何一个点到x到超平面 $w^T x+b=0$ 的距离 $r$ 可以表示为：
$r=\frac{|w^T x+b|}{||w||}$
“ $∣ ∣ ∣ ∣$ ”表二范数，“ $∣ ∣$ ”表示绝对值。SVM希望 $w^T x+b=±1$ 这两个超平面之间的间隔最大，这个间隔 $γ$ 用公式表达就是：
$γ=\frac{2}{||w||}$
未知量是 $w, b$ ，求解目标是间隔 $γ$ 最大化，约束条件是 $y(w^T x+b)≥1$ ，经典二分类SVM的优化目标用公式表达就是：
$\max\limits_{w,b} \frac{2}{||w||} \\ s.t. \quad y_i (w^T x_i+b)≥1, i=1, 2, …n.$

拉格朗日乘子法，对偶问题与KKT条件

前面已经介绍了SVM的基本思想，下面是具体求解过程。首先我们将上述优化目标转化为等价形式：
$\min\limits_{w,b} \frac{1}{2} ||w||^2 \\ s.t. \quad y_i (w^T x_i+b)≥1, i=1, 2, …n.$
由于目标函数和约束条件都是 $R^n$ （ $n$ 维实数向量空间）上连续可微的凸函数，所以这个等价形式是个凸优化问题，便于求解。凸优化问题原本有现成的计算方法和优化包可解，但是经典的SVM用的是更高效的算法。现在我们用拉格朗日乘子法建立拉格朗日函数 $L (w, b, α)$ ，这是机器学习中的常规方法：
$α)=\frac{1}{2} ||w||^2+\sum_{i=1}^nα_i (1-y_i (w^T x_i+b)) \\ s.t. \quad y_i (w^T x_i+b)≥1, i=1, 2, …n. \\ α=(α_1,α_2,…,α_n) , α_i≥0$
即最小化 $L (w, b, α)$ 。这个式子我们称为原问题。还是参数太多，难以求解。SVM使用原始问题和对偶问题做了进一步转化。我们现在假设有函数 $θ (α) = L (w, b, α)$ ，以 $α$ 为唯一参数，以 $w, b$ 为常数，且 $α_i≥0$ ，则 $θ (α)$ 一定是在 $α_i=0$ 时取得最大值 $\frac{1}{2} ||w||^2$ 。然后再对这个最大值以 $w, b$ 为参数求解最小值，这样的问题就与 $L (w, b, α)$ 等价。也就是说，最小化 $L (w, b, α)$ 等价于求解下式：
$\min\limits_{w,b} \max\limits_{α_i≥0}L(w, b, α)$
这个式子先以 $α$ 为参数求最大值，再以 $w, b$ 为参数求最小值，是一个最小最大化问题，称之为原始问题。它对应的有一个最大最小化问题，是对偶问题：
$\max\limits_{α_i≥0} \min\limits_{w,b} L(w, b, α)$
注意原始问题是关于 $w, b$ 的问题，而对偶问题是关于 $α$ 的问题。为了方便，我们假设原始问题的最优解为 $p^*$ ，对偶问题的最优解为 $d^*$ ，即
$\min\limits_{w,b} \max\limits_{α_i≥0}L(w, b, α)=p^* \\ \max\limits_{α_i≥0} \min\limits_{w,b} L(w, b, α) =d^*$
由于
$\min\limits_{w,b} L(w, b, α)≤L(w, b, α)≤\max\limits_{α_i≥0}L(w, b, α)$
所以
$d^*=\max\limits_{α_i≥0} \min\limits_{w,b} L(w, b, α)≤\min\limits_{w,b} \max\limits_{α_i≥0}L(w, b, α)=p^* \\ d^*≤p^*$
我们不加证明地给出以下结论：当满足Slater条件时，一定存在 $(w, b, α)$ 使得 $w, b$ 为原始问题的解， $α$ 为对偶问题的解，且 $d^*=p^*=L(w,b,α)$ 。Slater条件为，原问题是凸优化问题，且存在绝对可行点，所谓绝对可行点就是使得约束条件中的等式约束都成立，不等式约束都不取等号地成立的点。这样的点显然是存在的，就是那些非支持向量的点。因此对于SVM而言，我们又把问题转化成了求解原始问题和对偶问题,因为Slater条件告诉我们，把原始问题的解和对偶问题的解放在一起就是原问题的解。
为了求解，我们还需要引入KKT条件。同样不加证明地给出另一个结论： $w, b$ 和 $α$ 分别是原始问题和对偶问题的解的必要条件是w,b和α满足下面的KKT条件：

$\ L(w,b,α)$ 在 $w, b$ 两处的偏导为0；
$2]\ α_i (1-y_i (w^T x_i+b))=0 ,i=1,2,…,n$ ；
$3]\ y_i (w^T x_i+b)≥1,i=1,2,…,n$ ；
$4]\ α_i≥0,i=1,2,…,n$ ；

KKT条件告诉我们怎么去求解 $w, b$ 和 $α$ 。可以看到，条件 $[1]$ 即原问题在最初的变量上的偏导为0，条件 $[2]$ 即不等式约束乘以对应的拉格朗日系数为0，条件 $[3] [4]$ 还是原问题的约束条件。考虑条件 $[1]$ ,我们计算 $L (w, b, α)$ 在 $w, b$ 两处的偏导并分别令其为 $0$ ，可得到：
$\sum_{i=1}^nα_i y_i x_i=w \\ \sum_{i=1}^nα_i y_i=0$
将以上两式代入 $L (w, b, α)$ ：
$=\frac{1}{2} ||w||^2+\sum_{i=1}^nα_i (1-y_i (w^T x_i+b)) \\ =\frac{1}{2} w^T \sum_{i=1}^nα_i y_i x_i+\sum_{i=1}^nα_i- w^T \sum_{i=1}^nα_i y_i x_i-b \sum_{i=1}^nα_i y_i \\ =\sum_{i=1}^nα_i- \frac{1}{2} w^T \sum_(i=1)^nα_i y_i x_i-b*0 \\ =\sum_{i=1}^nα_i- \frac{1}{2} \sum_{i=1}^nα_i y_i x_i \sum_{j=1}^nα_j y_j x_j \\ =\sum_{i=1}^nα_i- \frac{1}{2} \sum_{i=1}^n\sum_{j=1}^nα_i α_j y_i y_j x_i^T x_j$
这就是我们现在经过对偶问题转化后的求解目标：
$\max\limits_α \sum_{i=1}^nα_i- \frac{1}{2} \sum_{i=1}^n\sum_{j=1}^nα_i α_j y_i y_j x_i^T x_j \\ s.t. \quad α_i≥0;\sum_{i=1}^nα_i y_i =0$
可以看到这个式子中唯一的变量是 $α$ ， $w, b$ 已经被约去了，有利于求解。而 $w$ 与 $α$ 的关系为 $\sum_{i=1}^nα_i y_i x_i=w$ ， $b$ 与 $α$ 的关系为的关系为 $α_i (1-y_i (w^T x_i+b))=0$ ，前面均已给出。在 $b$ 与 $α$ 的关系中，需要注意， $α_i$ 的值不可能都为 $0$ ，如果都为 $0$ 的话根据 $\sum_{i=1}^nα_i y_i x_i=w$ ， $w$ 也就恒为 $0$ 了，这显然是不可能的。当 $α_i$ 不为 $0$ ，对应的 $1-y_i (w^T x_i+b)$ 就必定为 $0$ ，对应的那些点就是支持向量。也就是说，超平面的表达式仅仅与支持向量有关，这与我们从图上得到的直观感受是一致的。

异常点，软间隔与核函数引入

我们前面一直假设这些样本点是线性可分的，即一定存在超平面可以将两类样本点分隔开，然而事实上这样的超平面有时并不存在，如下图：

图3 异常点的存在图3用蓝色和黄色的点表示两类样本，可以看到直线上方大部分是黄色点，但是有一个蓝色点；下方大部分是蓝色点，但是有一个黄色点。这两个异常点（Outliers）使得在当前空间中不存在线性的超平面可以将这两类点分隔开，虽然大部分点其实是线性可分的。

我们当然不希望一颗老鼠屎坏了一锅汤，因此引入“软间隔”的概念，允许一些错误样本存在。我们引入松弛变量 $ξ$ ：
$\min\limits_{w,b,ξ} \frac{1}{2}||w||^2+C\sum_{i=1}^nξ_i \\ s.t. \quad y_i (w^T x_i+b)≥1- ξ_i \\ ξ_i ≥0 , i=1, 2, …n$
只需要满足 $y_i (w^T x_i+b)+ξ_i≥1$ 即可，这时异常点就可以通过对应一个正值的 $ξ_i$ 来衡量它到自己类别一侧的距离，正常点对应的 $ξ_i$ 就为0。优化目标中也加入了 $\sum_{i=1}^nξ_i$ ， $C$ 是一个可调节的参数， $C$ 较大时对错误分类的乘法较大，较小时对错误分类的惩罚较小。如前所述，对这个式子使用拉格朗日乘子法：
$b,ξ,α,μ)=\frac{1}{2} ||w||^2+C\sum_{i=1}^nξ_i +\sum_{i=1}^nα_i (1-ξ_i-y_i (w^T x_i+b))-\sum_{i=1}^nμ_i ξ_i \\ s.t. \quad y_i (w^T x_i+b)≥1- ξ_i i=1,2,…,n \\ α_i≥0,μ_i≥0,ξ_i≥0$
新的 $L (w, b, ξ, α, μ)$ 同样满足Slater条件。然后应用KKT条件求解对应的原始问题和对偶问题：

$[1]\ L(w, b,ξ,α,μ)$ 在 $w, b, ξ$ 三处的偏导均为 $0$ ；
$[2]$ $α_i (1-ξ_i-y_i (w^T x_i+b))=0,i=1,2,…,n$ ；
$[3]$ $μ_i ξ_i=0 ,i=1,2,…,n$ ；
$[4]$ $y_i (W^T x_i+b)+ξ_i-1≥0 ,i=1,2,…,n$ ；
$[5]$ $α_i≥0, μ_i ≥0,ξ_i≥0,i=1,2,…,n$ ；
还是和前面类似，条件 $[1]$ 是原问题在最初的变量 $w, b, ξ$ 上的偏导为 $0$ ，条件 $[2] [3]$ 即不等式约束乘以对应的拉格朗日系数为 $0$ ，条件 $[4] [5]$ 还是原问题和拉格朗日乘子法的约束。现在我们把三个偏导为 $0$ 计算出来可以得到：
$\sum_{i=1}^nα_i y_i x_i =w \\ \sum_{i=1}^n α_i y_i =0 \\ C= α_i+μ_i$
再把三式代入 $L (w, b, ξ, α, μ)$ ，其实得到的结果和前一部分得到的结果一样，只是改变了 $α_i$ 的取值范围（因为 $C=α_i+μ_i$ 且 $μ_i ≥0$ ，所以 $0≤α_i≤C$ ），这里就不展开了，直接给出结果：
$\max_α \sum_{i=1}^nα_i- \frac{1}{2} \sum_{i=1}^n\sum_{j=1}^nα_i α_j y_i y_j x_i^T x_j \\ s.t.\quad 0≤α_i≤C \\ \sum_{i=1}^nα_i y_i =0$
这个式子仍然仅以 $α$ 为变量， $α$ 与 $w, b, ξ$ 的关系都由KKT条件给出了。到这里还没完，我们介绍的软间隔是为了优化线性不可分问题，软间隔只是优化这个问题的很多种方法之一，在SVM中还有一种常见的方法就是引入核函数（或称为核方法），这里一并介绍。
核函数的功能是通变换或映射，将在当前空间中线性不可分的样本点映射到新的空间中，使得样本点在新空间中变得线性可分。在SVM中，假设有一个映射 $ϕ (x)$ ，使得输入样本分布的欧式空间 $X$ 中的超曲面模型对应于一个特征空间 $H$ 中的超平面模型，这样，分类任务就可以通过在特征空间中求解线性的支持向量机来完成。核函数 $K (x, z)$ 是对于所有 $x, z \in X$ 都满足条件
$K (x, z) = ϕ (x) \cdot ϕ (z)$
的函数。其中 $ϕ (x)$ 是映射函数， $K (x, z)$ 是核函数， $ϕ (x) \cdot ϕ (z)$ 是 $ϕ (x)$ 和 $ϕ (z)$ 的内积。在机器学习中，经常只定义核函数 $K (x, z)$ ，而不显式地定义映射函数 $ϕ (x)$ ，直接计算 $K (x, z)$ 比较容易，计算 $ϕ (x) \cdot ϕ (z)$ 却不容易，而且 $H$ 一般是高维的甚至是无穷维的。

回到前面得到的求解目标，我们用核函数 $K(x_i,x_j )$ 代替其中的 $x_i^T x_j$ ，将样本点映射到线性可分的空间中：
$\max_α \sum_{i=1}^nα_i- \frac{1}{2} \sum_{i=1}^n\sum_{j=1}^nα_i α_j y_i y_j K(x_i,x_j ) \\ s.t.\quad 0≤α_i≤C \\ \sum_{i=1}^nα_i y_i=0$
这就是我们最终的优化目标了。

SMO算法求解

我们在前一部分得到了加入软间隔和核函数的SVM的优化目标，这也就是最常见的SVM了。即使约去了 $w, b, ξ$ ，这个优化目标仍然难以求解，因为 $α$ 是一个长度为 $n$ 的向量， $D$ 中样本数量越多求解就越复杂。虽然是个凸优化，但是用求导、偏导为0这样的方法仍然比较难解决，复杂度太高。这里介绍一种序列最小最优化（Sequential Minimal Optimization，SMO）算法，是常见的解决这一优化目标的方法。
$α=(α_1,α_2,...,α_n) , α_i≥0$
SMO算法是一种启发式算法，它的基本思路是：如果所有变量的解都满足此最优化问题的KKT条件，那么这个最优化问题的解就得到了。SMO重复以下步骤直到收敛：从 $α$ 中选取两个待更新的变量 $α_i,α_j$ ，固定其他值，构建一个二次规划的子问题；求解子问题，获得更新后的 $α_i,α_j$ 。因为这个子问题是可以通过解析方法求解的，所以大大提高了算法计算效率。子问题的两个变量，一个变量选违反KKT条件最严重的一个，另一个是可变化幅度最大的。这样SMO算法就不断将问题分解为对子问题的求解。

为了不失一般性，假设我们现在选取了两个变量 $α_1,α_2$ ，其他变量 $α_3,…,α_n$ 都是固定的。根据约束条件 $\sum_{i=1}^nα_i y_i=0$ 可知， $α_1 y_1+α_2 y_2$ 的值其实也是固定的。我们假设 $α_1,α_2$ 原本的值为 $α_1^old,α_2^old$ ，更新后的值为 $α_1^new,α_2^new$ ，则有：
$α_1^{new}y_1+α_2^{new} y_2=α_1^{old} y_1+α_2^{old} y_2=-\sum_{i=3}^nα_i y_i=ς$
$ς$ 是一个常数。原优化目标可以写为：
$\min_α \sum_{i=1}^nα_i- \frac{1}{2} \sum_{i=1}^n\sum_{j=1}^nα_i α_j y_i y_j K(x_i,x_j ) \\ s.t.\quad 0≤α_i≤C \\ \sum_{i=1}^nα_i y_i=0$
我们去掉优化目标中与 $α_1$ , $α_2$ 无关的项可得到：
$\min_{α_1,α_2} \frac{1}{2} K_{11} α_1^2+\frac{1}{2} K_{22} α_2^2+K_{12} α_1α_2y_1 y_2+α_1 y_1 \sum_{3}^{n}α_i y_i K_{i1}+α_2y_2 \sum_{3}^{n}α_i y_i K_{i2}-(α_1+α_2 ) \\ s.t.\quad α_1 y_1+α_2 y_2=ς, 0≤α_1,α_2≤C$
其中 $K_{ij}$ 表示 $K(x_i,x_j )$ 。然后用 $α_2$ 表示 $α_1$ ：
$α_1 y_1+α_2 y_2=ς \\ α_1 y_1 y_1+α_2 y_2 y_1=ςy_1=α_1 +α_2 y_1 y_2 \\ α_1 = y_1 (ς-α_2 y_2 )$
然后再把 $α_1$ 也约去，只留下 $α_2$ ：
$\min_{α_2} \frac{1}{2} K_{11} (ς-α_2 y_2)^2+1/2 K_{22} α_2^ 2+K_{12} (ς-α_2 y_2 ) α_2 y_2+(ς-α_2 y_2 ) v_1+α_2 y_2 v_2-α_2 -y_1 (ς-α_2 y_2 )$
其中：
$v_1=\sum_3^nα_i y_i K_{1i} \\ v_2=\sum_3^nα_i y_i K_{2i}$
上式对 $α_2$ 求导并令导数为 $0$ 得：
$α_2 (K_{11}+K_{22}-2K_{12} )=y_2 (y_2-y_1+ςK_{11}-ςK_{12}+v_1-v_2) \\ =y_2 (y_2-y_1+ςK_{11}-ςK_{12}+(g(x_1 )-\sum_1^2α_i y_i K_{1i}-b)-(g(x_2 )-\sum_1^2α_i y_i K_{2i}-b) \\ g(x)=\sum_1^nα_i y_i K(x,x_i )+b$
那么再将 $α_1^{old} y_1+α_2^{old} y_2=-\sum_{i=3}^nα_i y_i=ς$ 代进来，得到：
$α_2^{new,unc} (K_{11}+K_{22}-2K_{12} )=y_2 ((K_{11}+K_{22}-2K_{12} ) α_2^ {old} y_2+y_2-y_1+g(x_1 )-g(x_2 )) \\ =(K_{11}+K_{22}-2K_{12} ) α_2^ {old}+y_2 (E_1-E_1) \\ E_i=g(x_i )-y_i$
这里就可以得到：
$α_2^{new,unc}=α_2^{ old}+\frac{y_2 (E_1-E_2) }{K_{11}+K_{22}-2K_{12} }$
这个得到的新的 $α_2^{new}$ 还需要再根据取值范围再做调整，因此标记为"new,unc(lliped)"。这里可能有读者会疑惑为什么一会儿是 $α_2^{ new}$ 一会儿是 $α_2^ {old}$ ，解释一下，前面已经得到了唯一的关于 $α_2$ 的式子，这个式子的解就是 $α_2^{new,unc}$ ，但是我们在解的过程中引入了 $g (x)$ ，通过 $g (x)$ 引入的就是 $α_2^{ old}$ 。
因为约束条件比较多，解出来的结果 $α_2^{new,unc}$ 未必满足约束，所以我们考虑一下 $α_2$ 的取值范围。假设 $L≤α_2≤H$ ， $L, H$ 需要计算。

图4 $α_2$取值范围的确定

首先至少 $0≤α_1,α_2≤C$ 必须满足。前面已经得到 $α_1 y_1+α_2 y_2=ς$ ，注意 $y_1,y_2$ 的值要么是 $+ 1$ 要么是 $- 1$ 。考虑两种情况：

$[1]$ 若 $y_1!=y_2, α_1-α_2=ς$ ，即可画出图4的左侧图，上下两条斜线分别对应 $ς$ 为负和为正的情况，此时 $L = m a x (0, - ς), H = m i n (C, C - ς)$
$[2]$ 若 $y_1=y_2 , α_1+α_2=ς$ ，即可画出图4的右侧图，上下两条斜线分别对应 $ς$ 大于 $C$ 和小于 $C$ 的情况，此时 $L = m a x (0, ς - C), H = m i n (C, ς)$
这样我们就得到了 $L, H$ 的值。

根据得到的取值范围我们再调整前面算出的 $α_2^{new,unc}$ ，得到 $α_2^{new,clipped}$ ：
$α_2^{new,clipped}=\left\{ \begin{aligned} &H, & if α_2^{new,unc}>H \\ &α_2^{new,unc}, & if L≤ α_2^{new,unc}≤H \\ &L, & if α_2^{new,unc} < L \end{aligned} \right.$

这样就解决了 $α_2$ 的更新问题，进而解决了 $α_1$ 的更新。

我们还需要介绍 $α_1$ 和 $α_2$ 的选择方法。前面说SMO算法每次选取两个变量时，一个变量选择违反KKT条件最严重的，另一个变量是可变化幅度最大的。这里再细化一下具体怎样操作。

首先是怎样选取第一个变量 $α_1$ ，这个选取过程是SMO算法的外层循环。顺序是，首先遍历所有 $0<α_i0<αi<C$

然后是怎样选取第二个变量 $α_2$ ，标准是希望 $α_2$ 有足够大的变化。前面已经计算出，变化幅度依赖于 $E_1-E_2 |$ ， $α_1$ 确定后 $E_1$ 就确定下来了，如果 $E_1$ 为正就选择最小的 $E_i$ 为 $E_2$ ，如果 $E_1$ 为负就选最大的 $E_i$ 为 $E_2$ 。为了加快速度，所有的 $E_i$ 都被保存在一个列表中供随时查取。

在每次选取并更新完 $α_1,α_2$ 后，都需要重新计算 $b$ 。由KKT条件 $w=\sum_{i=1}^nα_i y_i x_i$ ，加入核函数并代入 $y=w^T x+b$ 可知：
$\sum_1^nα_i y_i K(x,x_i )+b=y$
则有：
$b_1^{new}=y_1-\sum_3^nα_i y_i K_{1i}-α_1^ {new} y_1 K_{11}-α_2^ {new} y_2 K_{12}$
由于 $E_i=g(x_i )-y_i= \sum_1^nα_i y_i K(x,x_i )+b-y_i$ ，得：
$y_1-\sum_3^nα_i y_i K_{1i}=-E_i+α_1^ {old} y_1 K_{11}+α_2^ {old} y_2 K_{12}+b_1^{old}$
也就是说：
$b_1=b-E_1-y_1 (α_1^ {new}-α_1^ {old} ) K_{11}-y_2 (α_2^{ new}-α_2^ {old} ) K_{12} \\ b_2=b-E_2-y_1 (α_1^{ new}-α_1^ {old} ) K_{11}-y_2 (α_2^ {new}-α_2^ {old} ) K_{12}$
一般的更新原则是：
$b=\left\{ \begin{aligned} &b_1, & if 0<α_1^{new}b=⎩⎪⎪⎪⎨⎪⎪⎪⎧b1,b2,2b1+b2,if0<α1new<Cif0<α2new<Cotherwise$

SVM小结

到这里我们就完成了SVM的介绍，这部分做个总结。
支持向量机SVM的核心思想就是寻找超平面分开不同类的点，并使得支持向量到超平面的距离最大化，超平面仅与支持向量有关。最简单的情况是线性可分支持向量机，条件是数据线性可分。为了处理非线性分布的数据，我们介绍了软间隔概念并引入核函数。在求解过程中，我们首先使用拉格朗日乘子法得到拉格朗日函数这个原问题，又证明了它与所谓的原始问题等价，满足Slatter条件表明原始问题与对应的的对偶问题和原问题的最值存在且相等，并且把前两者的解放在一起就是原问题的解。利用KKT条件我们得到了 $w, b$ 与 $α$ 的关系，简化了计算。SMO算法通过迭代地选择最不符合KKT条件的点和变化幅度最大的点，以及更新b值，加快了运算速度，解决了问题。
经典SVM仅面向二分类问题，要解决多分类问题需要构建多个SVM来完成，而且经典SVM不能给出分类准确率。SVM算法复杂度较高，在大规模样本量上难以快速训练。它的主要优点是，对异常点不敏感，增删非支持向量对模型无影响，在小样本数据上表现良好。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
22、文档：Google Docs的强大与易用性 pear55 探索云技术的无限可能 Google Docs 云端文档语音输入
文档：GoogleDocs的强大与易用性1.GoogleDocs简介GoogleDocs是Google提供的在线办公套件的一部分，它是一个基于云端的文字处
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

支持向量机原理及求解 SVM Slater条件 KKT条件 SMO算法 软间隔