白儿墨

这次一定要弄懂-SVM-3-Hard Margin SVM的对偶问题的求解（SMO算法）

文章目录

3-1 KKT条件

3-1-1 从拉格朗日乘数法的求解过程说起
3-1-2 推广出KKT条件
3-1-3 KKT条件用于原问题
3-1-4 KKT条件的作用：
3-1-5 决策边界中b的计算：

3-2 SMO算法

3-2-1 我们现在面临的棘手问题
3-2-2 破解对偶问题的神器SMO算法
3-2-3 SMO算法的理论推导

3-2-3-1 定义一些变量
3-2-3-2 KKT条件的作用
3-2-3-3 子问题的推导->如何优化选出的变量

3-2-3-3-1 转化为二元二次函数问题
3-2-3-3-2 确定$\alpha_j$的可行域
3-2-3-3-2 确定$\alpha_j$的值
3-2-3-3-3 确定$\alpha_i$的值
3-2-3-3-4 更新b
3-2-3-3-5 更新$E_k$

3-2-3-4 一些证明细节

3-2-3-4-1 SVM对偶问题的任意一个子问题都是凸优化问题（抛物线开口向上）
3-2-3-4-2 SVM算法收敛性的证明

3-2-3-5 优化变量的选择

3-2-4 总结SMO算法
3-3 总结

前面我们针对Hard Margin SVM推导了他的原问题：

\min \limits_{\bold{\omega}}\frac{||\omega||^2}{2}

s . t .

y^{(i)}(\bold{\omega}^T\bold{x^{(i)}}+b)\geqslant1 \quad\text{i=1,2,...m}

对应的对偶问题：

\min\limits_{\alpha} \frac{1}{2}\sum\limits_{i=1}^m\sum\limits_{j=1}^m\alpha_i\alpha_jy_iy_jx^{(i)}\cdot x^{(j)}-\sum\limits_{i=1}^m\alpha_i

$s . t .$
$\alpha_i\geqslant0\quad i=1,2,...,m$ $\sum\limits_{i=1}^m\alpha_iy_i=0$

以及决策边界中未知量w的计算方法：
$w=\sum\limits_{i=1}^m\alpha_iy^{(i)}x^{(i)}$

那决策边界中的未知量b如何计算呢？就要用了KKT条件，同时用于求解对偶问题的SMO算法也要应用到KKT条件，所以这一次的内容从KKT条件开始。

3-1 KKT条件

我们说广义拉格朗日乘子函数的构造是从原本只能解决带等式约束的拉格朗日乘数法推广而来，所以我们先从最原始的拉格朗日乘数法的求解开始过程开始。

3-1-1 从拉格朗日乘数法的求解过程说起

拉格朗日乘数法是求解带有等式约束的最优化问题

$\min\limits_{x}f(x)$
$h_i(x)=0,\quad i=1,2,...,p$

对应的求解方法就是构造拉格朗日乘子函数
$L(x,\lambda)=f(x)+\sum\limits_{i=1}^p\lambda_ih_i(x)$

接着对原始的优化变量以及乘子变量求导，并令导数为0，即：
$\begin{cases} \nabla_xf+\sum\limits_{i=1}^p\lambda_i\nabla_x h_i(x)=0\\ h_i(x)=0,\quad i =1,2,...,p \end{cases}$

解这个方程组就可以找到极值点，但目前只是把疑似极值点求出来了，至于是不是极值点，是极大还是极小点，还需要进一步判定。

所以上面的方程组只是取得极值的必要条件，而不是充分条件。

3-1-2 推广出KKT条件

针对既带有等式约束和不等式约束的优化问题，我们可以构造广义拉格朗日函数

$\min\limits_xf(x)$
$g_i(x)\leqslant0,\quad i=1,2,...q$
$h_i(x)=0,\quad i=1,2,...p$

构造拉格朗日乘子函数
$L(x,\lambda,\mu)=f(x)+\sum\limits_{i=1}^p\lambda_ih_i(x)+\sum\limits_{j=1}^q\mu_jg_j(x)$

设极值点为 $x^*$
在极值点出必须要满足：


1.原问题的约束条件	$g_i(x^)\leqslant0,\quad i=1,2,...q$ $h_i(x^)=0,\quad i=1,2,...p$
2.对偶问题的约束条件	$\mu_i\geqslant0,\quad i=1,2,...q$
3.松弛互补条件	$\mu_ig_i(x^*)=0,\quad i=1,2,...q$
4.X同时是拉格朗日函数的极小点 $\nabla_xL(x^*,\lambda,\mu)=0$	$\nabla_xf(x^)+\sum\limits_{i=1}^p\lambda_i\nabla_xh_i(x^)+\sum\limits_{j=1}^q\mu_j\nabla_xg_j(x^*)=0$

再次详细说明下其中的松弛互补条件：
根据 $\mu_ig_i(x^*)=0,\quad i=1,2,...q$
我们会发现
当 $\mu>0$ 时， $g_i(x^*)=0$ 。说明极值点在边界处取得。
当 $\mu=0$ 时， $g_i(x^*)\leqslant0$ 。说明这个不等式约束对函数没有影响。

以上四条就是KKT条件，它是对原问题最优解的约束，是最优解的必要条件。
但是如果原问题和对偶问题存在强对偶问题，则KKT条件就是取得极值的充要条件。

而我们的支持向量机的原问题不管是线性可分的还是不可分，即使加上后面的核函数，都是强对偶问题。使得我们可以使用KKT条件，得到极值点的一些特征。

3-1-3 KKT条件用于原问题

原问题：
$\min \limits_{\bold{\omega}}\frac{||\omega||^2}{2}$ $s . t .$ $y^{(i)}(\bold{\omega}^T\bold{x^{(i)}}+b)\geqslant1 \quad\text{i=1,2,...m}$

根据KKT条件中的松弛互补条件（对于不等式约束，乘子变量*函数值=0）
$\alpha_i\Big(y_i(w^Tx^{(i)}+b)-1\Big)=0,\quad i=1,2,...m$

我们仔细分析下松弛互补条件：
当 $\alpha_i>0$ 时， $y_i(w^Tx^{(i)}+b)=1$ —>支撑向量
当 $\alpha_i=0$ 时， $y_i(w^Tx^{(i)}+b)\geqslant1$ —>自由变量，对分类超平面不起作用

3-1-4 KKT条件的作用：

SMO算法选择优化变量
SMO算法是用于求解之后对偶问题的算法，它是一个迭代算法，每次仅选取两个乘子变量进行优化。KKT条件可以帮助我们寻找出需要优化的乘子变量。
迭代终止的判定规则
因为对于支持向量机来说KKT条件是极值点的充分必要条件，所以如果在迭代过程中发现待求点已经满足KKT条件了，那我们就把极值点解出来了，无须继续迭代。

3-1-5 决策边界中b的计算：

我们通过将原问题转化为拉格朗日对偶问题，使得最优化的变量从原本的w,b转换为拉格朗日乘子变量 $\alpha$

如果我们可以求得使得对偶问题最优的 $\alpha$ 后。则决策边界中的w可以通过 $w=\sum\limits_{i=1}^m\alpha_iy_ix^{(i)}$ 求得

而决策边界中b通过松弛互补条件求得。
前面说到，对于最优点来说，当 $\alpha_i>0$ 时， $y_i(w^Tx^{(i)}+b)=1$ 。
所以我们只需要到 $\alpha_i>0$ 对应的样本，求得b。

理论上来说，任意符合 $\alpha_i>0$ 的样本，都可以用来计算b的值，但由于计算有误差，一般为了减小误差，会用所有满足 $\alpha_i>0$ 的样本计算b，再取均值。

3-2 SMO算法

3-2-1 我们现在面临的棘手问题

前面讲到了对偶问题，让我们再看下推导得到的对偶问题

$\min\limits_{\alpha} \frac{1}{2}\sum\limits_{i=1}^m\sum\limits_{j=1}^m\alpha_i\alpha_jy_iy_jx^{(i)}\cdot x^{(j)}-\sum\limits_{i=1}^m\alpha_i$

$s . t .$
$\alpha_i\geqslant0\quad i=1,2,...,m$ $\sum\limits_{i=1}^m\alpha_iy_i=0$

为了方便之后进一步的推导，我们将对偶问题写成向量化的形式

$\min\limits_{\alpha} \frac{1}{2}\alpha^TQ\alpha-e^T\alpha$

$s . t .$
$y^T\alpha=0$ $\alpha_i\geqslant0,\quad i=1,2,...,m$

其中
矩阵 $Q_{ij}=y_iy_jx^{(i)}\cdot x^{(j)}$
向量 $e^T=[1,1,...,1]$

关于从 $\sum\limits_{j=1}^m\alpha_i\alpha_jy_iy_jx^{(i)}\cdot x^{(j)}$ 到 $\alpha^TQ\alpha$
应用了二次型展开。

这部分我不是熟悉，只依稀记得一个例子
$x^2+y^2+z^2=\begin{bmatrix} x &y&z \end{bmatrix}\begin{bmatrix} 1 & 0 &0\\ 0 & 1&0\\ 0 & 0 &1 \end{bmatrix}\begin{bmatrix} x\\ y\\ z \end{bmatrix}$
中间的矩阵对应的是原本的系数，所以Q本质上就是 $\alpha_i\alpha_j$ 的系数矩阵

这是一个大规模的二次函数的最优化问题，由于本身是凸优化问题，所以一些经典的最优化算法（如牛顿法，梯度下降法）可以收敛到极值点处。

但棘手的是还存在着等式约束和不等式约束，所以需要更好的求解算法，那就是SMO算法（序列最小最优化算法）

从SVM提出，到SMO算法提出之前，SVM并没有广泛使用就是因为这个对偶问题的求解非常麻烦。

3-2-2 破解对偶问题的神器SMO算法

SMO算法（Sequential minimal optimization）序列最小最优算法的核心思想是分治法（把一个大问题拆解成很多子问题来求解，然后把解合并起来，形成大问题的解）

SMO算法的巧妙之处在于每次选取两个变量进行优化。为什么不只选出一个变量进行优化呢？

因为我们有一个等式约束 $\sum\limits_{i=1}^m\alpha_iy_i=0$ ,如果只有一个 $\alpha$ 变化的话，就会破坏原来的等式约束。

因此只调整一个变量是不行的，最少要调整2个变量。

根据这个想法，就可以把原来的m元2次问题转化成2元2次问题。

而对于2元2次函数的极值问题的求解就是初中内容了，可以通过等式约束，消掉一个变量，变成一元二次函数求极值的问题。

一元二次函数就是一个抛物线，但因为有 $\alpha\geqslant0$ 的限定条件，所以我们需要根据这个情况来进行极值的讨论。

3-2-3 SMO算法的理论推导

3-2-3-1 定义一些变量

之后原来代换的变量也写在这边，方便查看


定义矩阵Q	$Q_{ij}=y_iy_jX_i^TX_j$
定义 $u_i$	$u_i=\sum\limits_{j=1}^my_j\alpha_jX_j\cdot X_i+b$ $u_i$ 相当于把第i个样本带到我们的预测函数中

定义 $K_{ij}$	$K_{ij}=X_i^{T}X_j$
定义s	$s=y_1y_2$
定义 $v_i$	$v_i=\sum\limits_{k=1,k=\not i,k=\not j}^m y_k\alpha_kK_{ik}$
定义 $\xi$	$\xi=y_i\alpha_i+y_j\alpha_j = -\sum\limits_{k=1,k=\not i,k=\not j}^m y_k\alpha_k$

定义 $w$	$w=\xi y_i$

定义 $\eta$	$\eta=K_{ii}+K_{jj}-2K_{ij}$
定义 $E_i$	$E_i=u_i-y_i$

3-2-3-2 KKT条件的作用

再回忆KKT条件：
$\begin{cases} \alpha_i>0 & y_i(w^Tx^{(i)}+b)=1\\ \alpha_i=0 & y_i(w^Tx^{(i)}+b)\geqslant1 \end{cases}$

之前讲到，KKT条件用于选择优化变量，判定迭代是否终止

选择优化变量：
KKT条件帮助我们选择每次哪两个变量来优化，怎么挑呢？只要这个变量违反KKT条件，我们就把它挑出来。
所以如果不满足kkt条件，就一定不是极值点，所以我们要把它挑出来，调整 $\alpha$ 使得满足KKT条件
判定迭代的依据：
如果alphai都满足，说明找到了极值点。

所以大体上SMO算法的流程图为：

根据SMO算法的流程图，可以看出我们需要解决的几个小问题，分别是如何初始化，如何选出优化变量，如何优化选出的变量。先就其中最繁琐的如何优化选出的变量说起。

3-2-3-3 子问题的推导->如何优化选出的变量

3-2-3-3-1 转化为二元二次函数问题

假如我们已经通过KKT条件，从m个 $\alpha$ 中已经选出了需要优化的2个变量 $\alpha_i,\alpha_j$

这时对于对偶问题 $f(\alpha)=\frac{1}{2}\sum\limits_{i=1}^m\sum\limits_{j=1}^m\alpha_i\alpha_jy_iy_jx^{(i)}\cdot x^{(j)}-\sum\limits_{i=1}^m\alpha_i$ 来说，只有 $\alpha_i$ 和 $\alpha_j$ 是变量，其他的都是常量，这时我们的目标函数就转化成了二元二次函数，再根据等式约束，可以进一步转化为一元二次求极值的问题。

我们将上式整理下，写成 $\boxed{\text{系数}}\alpha_i^2+\boxed{\text{系数}}\alpha_j^2+\boxed{\text{系数}}\alpha_i\alpha_j+\boxed{\text{系数}}\alpha_i+\boxed{\text{系数}}\alpha_j+\boxed{\text{系数}}$ 这样的形式
$g(\alpha_i,\alpha_j)=\frac{1}{2}K_{ii}\alpha_i^2+\frac{1}{2}K_{jj}\alpha_j^2+sK_{ij}\alpha_i\alpha_j+y_iv_i\alpha_i+y_jv_j\alpha_j-\alpha_i-\alpha_j$

其中
$s=y_1y_2$
$v_i=\sum\limits_{k=1,k=\not i,k=\not j}^m y_k\alpha_kK_{ik}$

约束条件为
$\alpha_i\geqslant0$
$\alpha_j\geqslant0$

$\sum\limits_{k=1}^my_k\alpha_k=0$ 由此可以推出
$y_i\alpha_i+y_j\alpha_j = -\sum\limits_{k=1,k=\not i,k=\not j}^m y_k\alpha_k=\xi$

接下来的目标就是计算 $f(\alpha_i,\alpha_j)$ 的极值

3-2-3-3-2 确定 $\alpha_j$ 的可行域

因为
$y_i\alpha_i+y_j\alpha_j = -\sum\limits_{k=1,k=\not i,k=\not j}^m y_k\alpha_k=\xi$

所以
$\alpha_i+y_iy_j\alpha_j=y_i\xi$
由于 $y_iy_j$ 的正负号不知，所以一共对应四种情形，同时我们还可以尝试确定下 $\xi$ 的正负

序号	$y_i$	$y_j$	$\alpha_i+y_iy_j\alpha_j=y_i\xi$	$\xi$
1	+	+	$\alpha_i+\alpha_j=\xi$	+
2	-	-	$\alpha_i+\alpha_j=-\xi$	-
3	+	-	$\alpha_i-\alpha_j=\xi$	不知
4	-	+	$\alpha_i-\alpha_j=-\xi$	不知

对应这四种情况，我们可以通过图像，分别确定出 $\alpha_j$ 的取值范围

序号	$y_i$	$y_j$	$\alpha_i+y_iy_j\alpha_j=y_i\xi$	$\xi$
1	+	+	$\alpha_i+\alpha_j=\xi$	+	Low boundary = $0$ High boundary= $\alpha_i+\alpha_j$
2	-	-	$\alpha_i+\alpha_j=-\xi$	-	Low boundary = $0$ High boundary= $\alpha_i+\alpha_j$
3	+	-	$\alpha_i-\alpha_j=\xi$	不知	Low boundary = $\max\{0,\alpha_i-\alpha_j\}$ High boundary= $+\infin$
4	-	+	$\alpha_i-\alpha_j=-\xi$	不知	Low boundary = $\max\{0,\alpha_i-\alpha_j\}$ High boundary= $+\infin$

最终总结下 $\alpha_j$ 的取值范围
$\begin{cases} \alpha_j \in [0,\alpha_i+\alpha_j] & y_iy_j=1\\ \alpha_j\in [\max\{0,\alpha_i - \alpha_j\},+\infin)& y_iy_j=-1 \end{cases}$

3-2-3-3-2 确定 $\alpha_j$ 的值

由于 $\alpha_i$ 与 $\alpha_j$ 存在等式关系,即 $y_i\alpha_i+y_j\alpha_j=\xi$ ，
左右同时乘以 $y_i$ 得
$\alpha_i+y_iy_j\alpha_j=\xi y_i$ ,即
$\alpha_i+s\alpha_j=\xi y_i$
令 $w=\xi y_i$
故 $\alpha_i=w-s\alpha_j$

所以我们将上式带入
$g(\alpha_i,\alpha_j)=\frac{1}{2}K_{ii}\alpha_i^2+\frac{1}{2}K_{jj}\alpha_j^2+sK_{ij}\alpha_i\alpha_j+y_iv_i\alpha_i+y_jv_j\alpha_j-\alpha_i-\alpha_j$
就可以得到关于 $\alpha_j$ 的一元二次函数，接下来就是这个带入过程。

$g(\alpha_j)=\frac{1}{2}K_{ii}(w-s\alpha_j)^2+\frac{1}{2}K_{jj}\alpha_j^2+sK_{ij}(w-s\alpha_j)\alpha_j+y_iv_i(w-s\alpha_j)+y_jv_j\alpha_j-(w-s\alpha_j)-\alpha_j$

我们可以通过对 $g(\alpha_j)$ 求导=0，得到极值点的位置

$g'(\alpha_j)=K_{ii}(w-s\alpha_j)(-s)+K_{jj}\alpha_j+sK_{ij}w-2s^2K_{ij}\alpha_j-sy_iv_i + y_jv_j+s-1=0$

在整理过程中，我们使用一个小技巧
$sy_iv_i=y_iy_jy_iv_i=y_jv_i$

带入目标函数中得到
$\big(K_{ii}+K_{jj}-2K_{ij}\big)\alpha_j=sw\big(K_{ii}-K_{ij}\big)+y_jv_i-y_jv_j-s+1$

等号的右边可以进一步简化成和左边相似的结构。
用到一些小技巧比如
$sw=y_iy_jy_i\xi=y_j\xi$
其中 $\xi=\alpha_i^*y_i+\alpha_j^*y_j$
$\alpha_i*$ 和 $\alpha_j^*$ 表示未迭代的值

所以 $sw=y_j(\alpha_i^*y_i+\alpha_j^*y_j)$

将 $sw=y_j(\alpha_i^*y_i+\alpha_j^*y_j)$ 带入右式，同时让 $s=y_iy_j$ ， $1=y_jy_j$
$\begin{aligned} &sw\big(K_{ii}-K_{ij}\big)+y_jv_i-y_jv_j-s+1 \\ &=y_j(\alpha_i^*y_i+\alpha_j^*y_j)\big(K_{ii}-K_{ij}\big)+y_jv_i-y_jv_j-y_iy_j+y_jy_j\\ &=y_iy_j\alpha_i^*K_{ii}+\alpha_j^*K_{ii}-y_iy_j\alpha_i^*K_{ij}-\alpha_j^*K_{ij}+y_j\big(v_i-v_j+y_j-y_i\big)\\ \end{aligned}$

接下来的化简要将 $v_i$ 用 $u_i$ 表示

回忆
$v_i=\sum\limits_{k=1,k=\not i,k=\not j}^m y_k\alpha_kK_{ik}=X_i\cdot\sum\limits_{k=1,k=\not i,k=\not j}^m y_k\alpha_kX_k$
$u_i=\sum\limits_{j=1}^my_j\alpha_jK_{ij}+b=X_i\cdot\sum\limits_{j=1}^my_j\alpha_jX_{j}+b=v_i+\textcolor{blue}{y_i\alpha_i^*X_iX_i+y_j\alpha_j^*X_jX_i+b}$

也就是说
$v_i-v_j=u_i-u_j+y_j\alpha_jX_jX_j+y_i\alpha_iX_iX_j-y_i\alpha_iX_iX_i-y_j\alpha_jX_jX_i$
$=u_i-u_j+y_j\alpha_j^*K_{jj}+y_i\alpha_i^*K_{ij}-y_i\alpha_i^*K_{ii}-y_j\alpha_j^*K_{ij}$

所以等号右边可以继续化简
$=y_iy_j\alpha_i^*K_{ii}+\alpha_j^*K_{ii}-y_iy_j\alpha_i^*K_{ij}-\alpha_j^*K_{ij}+y_j\big(v_i-v_j+y_j-y_i\big)$
$=y_iy_j\alpha_i^*K_{ii}+\alpha_j^*K_{ii}-y_iy_j\alpha_i^*K_{ij}-\alpha_j^*K_{ij}+y_j\big(u_i-u_j+y_j\alpha_j^*K_{jj}+y_i\alpha_i^*K_{ij}-y_i\alpha_i^*K_{ii}-y_j\alpha_j^*K_{ij}+y_j-y_i\big)$
$=y_iy_j\alpha_i^*K_{ii}+\alpha_j^*K_{ii}-y_iy_j\alpha_i^*K_{ij}-\alpha_j^*K_{ij}+\alpha_j^*K_{jj}+s\alpha_i^*K_{ij}-s\alpha_i^*K_{ii}-\alpha_j^*K_{ij}+y_j\big((u_i-u_j)-(y_i-y_j)\big)$
$=\alpha_j^*\big(K_{ii}+K_{jj}-2K_{ij}\big)+y_j\big((u_i-u_j)-(y_i-y_j)\big)$

这时，等号的左右边都有 $K_{ii}+K_{jj}-2K_{ij}\big)$ ，对于取得极值点的 $\alpha_j$ 可以进一步化简
设
$\eta=K_{ii}+K_{jj}-2K_{ij}$
$E_i=u_i-y_i$

$\eta\alpha_j=\alpha_j^*\eta+y_j(E_i-E_j)$
所以 $\alpha_j=\alpha_j^*+\frac{y_j(E_i-E_j)}{\eta}$

这是在无约束时，使得 $g(\alpha_i,\alpha_j)$ 最小的点，我们令其为 $\alpha_j^{best}$ 但由于 $\alpha_j$ 还存在不等式约束
$\begin{cases} \alpha_j \in [0,\alpha_i+\alpha_j] & y_iy_j=1\\ \alpha_j\in [\max\{0,\alpha_i - \alpha_j\},+\infin)& y_iy_j=-1 \end{cases}$

所以再根据约束，进一步考虑最终迭代后 $\alpha_i的值$
对应的一共有三种情况

情况一	情况二	情况三

最终迭代后 $\alpha_j^{new}$ 的值为
$\alpha_j^{new}=\left\{ \begin{aligned} &L & \quad\text{if }\alpha_j^{best}<L\\ &\alpha_j^{best} &\quad\text{if }L\leqslant\alpha_j^{best}\leqslant H \\ &H &\quad\text{if }\alpha_j^{best}>H \end{aligned} \right.$

3-2-3-3-3 确定 $\alpha_i$ 的值

因为 $\alpha_i^{new}y_i+\alpha_j^{new}y_j=\alpha_i^*y_i+\alpha_j^*y_j$
所以迭代后
$\alpha_i^{new}=\alpha_i^*+s(\alpha_j^*-\alpha_j^{new})$

3-2-3-3-4 更新b

如果 $\alpha_1>0$
则 $\sum\limits_{k=1}^my_k\alpha_kX_kX_1+b_1^{new}=y_1$
即 $\sum\limits_{k=3}^my_k\alpha_kX_kX_1+\alpha_1^{new}y_1K_{11}+\alpha_2^{new}y_2K_{21}+b_1^{new}=y_1$
所以 $b_1^{new}=y_1-\sum\limits_{k=3}^my_k\alpha_kX_kX_1-\alpha_1^{new}y_1K_{11}-\alpha_2^{new}y_2K_{21}$

未更新的 $E_1=\sum\limits_{k=3}^my_k\alpha_kK_{k1}+\alpha_1^{*}y_1K_{11}+\alpha_2^{*}y_2K_{21}+b^{*}-y_1$
所以可得 $y_1-\sum\limits_{k=3}^my_k\alpha_kK_{k1}=-E_1+\alpha_1^{*}y_1K_{11}+\alpha_2^{*}y_2K_{21}+b^*$

故
$b_1^{new}=-E_1+\alpha_1^{*}y_1K_{11}+\alpha_2^{*}y_2K_{21}+b^*-\alpha_1^{new}y_1K_{11}-\alpha_2^{new}y_2K_{21}$
$=b^*-E_1+y_1K_{11}(\alpha_1^*-\alpha_1^{new})+y_2K_{21}(\alpha_2^*-\alpha_2^{new})$

同理可得
$b_2^{new}=b^*-E_2+y_1K_{12}(\alpha_1^*-\alpha_1^{new})+y_2K_{22}(\alpha_2^*-\alpha_2^{new})$

最终 $b^{new}$ 的取值为
$b^{new}=\frac{b_1^{new}+b_2^{new}}{2}$
对b的更新还不是十分确定，先暂时按这样的方式实现下代码

3-2-3-3-5 更新 $E_k$

每次完成两个变量的优化之后，还必须更新对应的 $E_k$ ，并将他们保存在列表中， $E_k$ 值的更新要用到 $b_{new}$
$E_k^{new}=\sum\limits_{i=1}^my_i\alpha_iK_{ik}+b^{new}-y_k$

3-2-3-4 一些证明细节

3-2-3-4-1 SVM对偶问题的任意一个子问题都是凸优化问题（抛物线开口向上）

用到的方法利用是Hessian矩阵判断

子问题的Hessian矩阵为
$\begin{bmatrix} Q_{ii} & Q_{ij}\\ Q_{ji} & Q_{jj} \end{bmatrix}$
可以写成如下矩阵乘积的形式
$\begin{bmatrix} y_iX_i^T \\ y_iX_j^T \end{bmatrix} \begin{bmatrix} y_iX_i & y_jX_j \end{bmatrix}=A^TA$
任意的向量x
$x^TA^TAx=(Ax)^T(Ax)\geqslant0$
所以Hessian矩阵半正定，因此目标函数一定为凸函数

3-2-3-4-2 SVM算法收敛性的证明

因为无论迭代时，两个变量的初始值时多少，通过上面的子问题求解算法得到的是在可行域内的最小值，因此每次更新完这两个变量后，都能保证目标函数的值小于或者等于初始值，即函数值下降。同时SVM要求解的对偶问题是凸优化问题，有全局最小解，所以SMO算法能保证收敛。

3-2-3-5 优化变量的选择

使用KKT条件，挑选出违反KKT条件的样本，进行优化。

根据前面的推导，在最优点处必须满足
$\begin{cases} \alpha_i>0 & y_i(w^Tx^{(i)}+b)=1\\ \alpha_i=0 & y_i(w^Tx^{(i)}+b)\geqslant1 \end{cases}$

其中 $w$ 用 $\alpha$ 来表示
设
$u_i=\sum\limits_{j=1}^my_j\alpha_jX_j\cdot X_i+b$
所以在最优点处必须满足

$\begin{cases} \alpha_i>0 & y_iu_i=1\\ \alpha_i=0 & y_iu_i\geqslant1 \end{cases}$

根据上式，依此检查所有样本，如果违反了上面的条件，则需要优化。
优先优化 $\alpha_i>0$

第二个变量的选择，选择使 $E_i-E_j|$ 最大化的值。
其中 $E_i=u_i-y_i$

为什么选 $E_i-E_j|$ 最大的呢？因为这样选出来的值，通过调整后，使得目标函数下降最快

3-2-4 总结SMO算法

操作过程：

为 $\alpha_i$ 设置初始值，让 $\alpha_i=0$
目的在于让初始的 $\alpha$ 满足等式约束和不等式约束
外层循环：
根据KKT条件选择两个优化变量
求解子问题
如果已经收敛，则退出，否则继续循环
结束循环

3-3 总结

终于把KKT条件和SMO算法整理好啦，发现这些理论推导，多试着推一推，也没有想象中那么恐怖。
接下来打算在下一篇文章中，整理下整个Hard Margin SVM的计算过程，并用python实现下。

AI入门——AI大模型、深度学习、机器学习总结超级-码力人工智能深度学习机器学习 AIGC
以下是对AI深度学习、机器学习相关核心技术的总结与拓展，结合技术演进逻辑与前沿趋势，以全新视角呈现关键知识点一、深度学习：从感知到认知的技术革命核心突破：自动化特征工程的范式变革深度学习通过多层神经网络架构（如卷积神经网络CNN、循环神经网络RNN），实现了从原始数据中自主学习分层特征的能力。相较于传统机器学习依赖人工设计特征（如SVM的核函数、手工提取的图像边缘特征），其核心优势体现在：层次化抽
机器学习—逻辑回归 60岁的程序猿 1024程序员节机器学习逻辑回归人工智能算法
本内容是博主自学机器学习总结的。由于博主水平有限，内容可能有些许错误。如有错误，请发在评论区。目录1、基础概念1.1、什么是逻辑回归1.2、逻辑回归与线性回归的区别1.3应用场景2、逻辑回归模型2.1、模型定义2.2、Sigmoid函数2.3、决策边界2.4、概率解释3、模型训练3.1、损失函数3.2、梯度下降法3.3、牛顿法3.4、拟牛顿法3.4、正则化3.5、总结4、多分类问题4.1、一对多（
巴尔加瓦算法图解：K最近邻算法 Ashleyxxihf 码上行动：巴尔加瓦算法图解算法近邻算法
巴尔加瓦算法图解：K最近邻算法目录巴尔加瓦算法图解：K最近邻算法判断水果创建推荐系统1.判断相似程度练习回归（预测结果）机器学习总结本章内容❑学习使用K最近邻算法创建分类系统。❑学习特征抽取。❑学习回归，即预测数值，如明天的股价或用户对某部电影的喜欢程度。❑学习K最近邻算法的应用案例和局限性。判断水果判断这个水果是橙子还是柚子呢？一种办法是看它的邻居。来看看离它最近的三个邻居。在这三个邻居中，橙子
大数据开发之机器学习总结（一）闻香识代码大数据机器学习用户画像机器学习大数据算法
大数据开发之机器学习总结1.背景在大数据开发中，数据分析目的一般分为2大类，一个是基于已有数据，提炼出想要的数据汇总信息。一个是基于已有数据使用算法训练出模型，基于模型预测和分析未来的新数据。前者就是很多时候的大数据分析场景，后者则涉及到算法模型，机器学习的范畴。更进一步，人工智能，但机器学习和人工智能，本身其实技术上并没有非常严格的界限。2.机器学习概念机器学习，故名思意，让机器通过学习过去的经
机器学习总结净土_0342
朴素贝叶斯fromsklearnimportdatasetsiris=datasets.load_iris()fromsklearn.naive_bayesimportGaussianNBgnb=GaussianNB()y_pred=gnb.fit(iris.data,iris.target).predict(iris.data)支持向量机fromsklearnimportsvmX=[[0,0],
深度之眼-机器学习总结任嘉平生愿
为期三个月的西瓜书机器学习训练营结束，昨天听完了毕业典礼。我做了如下总结：校长讲话：定目标短时间自己的小团队闭环开环闭环----学习小部分就应用时间和努力的堆积打比赛应用人工智能的课题和方向资料tensorflow实战google深度学习框架和强者学习才会遇强则强博士讲话：1.坚持写博客2.github3.多练习4.英文原版的文章高级课程你目前的弱点是什么5.多读论文
机器学习总结 gridlayout 机器学习人工智能
对以下文章机器学习总结什么是深度学习?最易懂的机器学习入门文章-CSDN博客人工智能和机器学习之间的关系人工智能是一个最宽泛的概念，是一个研究领域，同时也是一个实现目标，而机器学习则是实现这一目标的一类方法。深度学习只是机器学习这一类方法中的一种。机器学习之前的建模方式对比:深度学习改变了很多领域算法的实现模式。在深度学习兴起之前，很多领域建模的思路是投入大量精力做特征工程，将专家对某个领域的“人
2023 Google开发者大会：你了解机器学习的新动向吗？ Mr.Winter` 前沿资讯机器学习人工智能 google 数据挖掘计算机视觉语音识别深度学习
目录0年度科技盛会1生成式机器学习2无障碍游戏体验3跨平台机器学习总结0年度科技盛会2023Google开发者大会在上海浦东举办，为开发者和科技爱好者们带来新技术、新产品、新动向可能很多同学对Google开发者大会还不熟悉，Google开发者大会是Google展示最新产品和平台的年度盛会，为开发者提供丰富的学习资源、实践操作和现场演示，提供与Google专家互动、与其他开发者交流的契机，助力开发提
【机器学习】许多仙机器学习算法支持向量机
说明：机器学习总结0、数据集1、贝叶斯分类器（一）计算题所有样本分为两类（c）：好瓜=是、好瓜=否（1）计算先验概率：P(c)（2）计算每个属性的条件概率：P(xi|c)（3）代入朴素贝叶斯公式：（4）结论：（5）拉普拉斯修正（平滑处理，可选）上面的公式中出现连乘现象，这会导致对于0特别敏感，比如出现一个0，就会直接导致最终结果直接为0其中：N——所有类别数，这里一个有两类，所以N=2Ni——第i
数字验证码识别新思路及对opencv支持向量机机器学习总结快乐的阿常艾念宝机器学习杂谈＆随想机器学习 opencv 支持向量机
验证码识别框架新问题最近遇到了数字验证码识别的新问题。由于这次的数字验证码图片有少量变形和倾斜，所以，可能需要积累更多的原始采样进行学习。但按照4个验证码10个数字的理论随机组合(暗含某种数字仅有少量变化，不然此组合数量还应更大)，也就是要采样差不多一万张图片；对每个图片适当分割后，那就差不多几万张图片了。想要对这些切割后的图片进行手工分类，成为基本数字的训练学习数据，手工工作量不小，也很无趣。当
机器学习总结（lecture 4）算法：逻辑回归Logistic Regression （LR）九方先生机器学习总结
lecture4：逻辑回归LogisticRegression目录lecture4逻辑回归LogisticRegression目录1分类和模型表示2逻辑回归1逻辑回归的代价函数的选取3过拟合和正则化1分类和模型表示先来谈谈二分类问题。课程中先给出了几个例子。邮件是垃圾邮件还是非垃圾邮件；网上交易是的欺骗性（YorN）；肿瘤是恶性的还是良性的。对于这些问题，我们可以通过输出值yϵ{0,1}来表示。注
朴素贝叶斯——机器学习总结古月哥欠666 机器学习算法
朴素贝叶斯基础知识概念优缺点一般过程利用python进行文本分类准备数据训练算法测试算法示例1：使用朴素贝叶斯过滤垃圾邮件一般步骤准备数据：切分文本测试算法：使用朴素贝叶斯进行交叉验证示例2：使用朴素贝叶斯分类器从个人广告中获取区域倾向一般步骤收集数据：导入RSS源RSS源分类器及高频词去除函数分析数据：显示地域相关的用词基础知识概念从简单的概率分类器开始，给出一些假设（条件独立性）学习朴素贝叶斯
Python-Level5-day07am:聚类的基于噪声密度/凝聚层次算法及评价指标及小结,机器学习补充练习,机器学习总结, dpq666dpq666 数据分析人工智能 python
之前讲解了基于中心聚类，采用kmeans聚类算法，下面讲解基于噪声密度聚类算法DBSACN与基于层次聚类算法（Agglomerative）算法2）噪声密度①算法定义噪声密度（Density-BasedSpatialClusteringofApplicationswithNoise，简写DBSCAN）随机选择一个样本做圆心，以事先给定的半径做圆，凡被该圆圈中的样本都被划为与圆心样本同处一个聚类，再以
机器学习总结-基于sklearn包 zaprily 总结 sklearn python 机器学习
流程集成学习数据预处理（特征工程）1.处理负值（oroutlier）标记有问题的特征，但是不删去defgetres1(row):returnlen([xforxinrow.valuesiftype(x)==intandx20,'neg1']=20#平滑处理2.填充缺失值缺失值也可以删去样本或者特征，不过在样本量比较少，特征不明确的情况下不建议直接删除特征。可以直接用fillna补充data['le
《吴恩达机器学习》18 机器学习总结 JockerWong 机器学习吴恩达机器学习课程总结
前言原机器学习最后一章的内容为图片文字识别，但是笔者在看了这一章的课程之后发现其内容可能实际应用性不大，课程讲的ocr识别的方法已经不适合目前主流的算法（目前主流使用CNN——卷积神经网络），故省略这一章节的笔记，改为对整个机器学习课程的总结。一、监督学习算法1、线性回归线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。其表达形式为hθ
吴恩达机器学习总结（三）——神经网络的反向传播 Anaconda_ 机器学习深度学习机器学习神经网络反向传播
神经网络的反向传播在上一篇博客中，利用神经网络对手写数字数据进行分类的结果虽然已经很高了，但和测试样本本身的输出值进行比较还是存在着一定的误差。这时我们需要使用这个误差值来调整神经网络本身，进而改变神经网络的输出值。误差传递我们知道在前向传播中，每个节点向下一层传递的信号所占权重不同。若只有一个节点的信号传递到输出节点，那调整神经网络输出值的方式将简单的多，只需要更新这个节点的权重即可。假如有多个
博客目标与内容 Geng Rain python
目标量化学习总结回测框架Backtrader量化机器人的搭建因子模型技术分析编程学习总结网络编程python基础数学学习总结高数线性代数概率论机器学习总结pytorch神经网络强化学习具体项目总结目标管理app打卡app学习方法总结学习方法
机器学习总结奋斗的海绵机器学习数据分析数据挖掘
（1）x（2）表示训练集中x的第二个训练数据，y(2)表示训练集中的y的第二个训练数据（2）需要注意的是对于一个模型构建出来的函数F，那么我们如何找出该模型的可以更好拟合训练数据的模型参数呢，我们通过使用代价函数（costfunction），通过计算不同的参数得到的预测值y和最终结果y之间的误差大小来最终确定应该如何选择最佳的参数。（3）梯度下降算法被用来寻找使得代价函数J的最小值，从而确定其此时
分布式机器学习总结 Liao_Wenzhe 机器学习与数据挖掘分布式数据研发大数据
目前主流的分布式架构包括：1.基于mapreduce模型的spark-mllib，采用数据分布式+同步的模式，缺点是对异步和模型分布式不支持，但是社区完善。2.基于参数服务器的Multiverso，既可实现数据分布式，也可实现模型分布式，同时支持异步和同步，也可实现大规模的参数更新。3.基于数据流图的tensorflow，可以和1，2结合组成复杂的分布式机器学习网络。4.3种模式的区别：5.各种框
百面机器学习总结笔记（第二章模型评估） Avery123123 算法岗面试笔试准备百面机器学习模型评估
百面机器学习总结笔记（第二章模型评估）百面机器学习总结笔记第二章模型评估第1节评估指标的局限性问题：准确率的局限性问题：精确率与召回率的权衡第2节ROC曲线问题：什么是ROC曲线？问题：如何绘制ROC曲线？问题：如何计算AUC？问题：ROC曲线相比于P-R有什么特点？第3节余弦距离的应用第4节A/B的陷阱第5节模型评估的方法问题：在模型评估中，有哪些主要的评估方法，他们的优缺点是什么？问题：在自助
机器学习总结 Bryant998 人工智能 python
均值、中值和众数从一组数字中我们可以学到什么？在机器学习（和数学）中，通常存在三中我们感兴趣的值：均值（Mean）-平均值中值（Median）-中点值，又称中位数众数（Mode）-最常见的值例如：我们已经登记了13辆车的速度：speed=[99,86,87,88,111,86,103,87,94,78,77,85,86]什么是平均，中间或最常见的速度值？均值均值就是平均值。要计算平均值，请找到所有
若特征的相关系数为0或接近0，就一定可以被过滤吗？相关系数的显著性检验也不一定可靠，如何判断？陈谦机器学习人工智能算法 python
系列文章目录添加机器学习总结提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、若特征的相关系数为0或接近0，就一定可以被过滤吗？二、验证步骤1.通过皮尔逊相关系数得出的结论，名称一样的特征排名靠后，反而在模型训练之后的特征重要性在中间。同样的模型得出的特征排名靠后反而皮尔逊相关系数靠前。总结前言若特征的相关系数为0或接近0，就一定可以被过滤吗？相关系数的显
周志华机器学习总结夜夜0810
Lecture3线性模型基本形式一般向量形式:优点:线性回归广义线性模型对数几率回归由对数几率函数确定$\boldsymbol{\omega}$和$b$线性判别分析(LDA)思想求解多分类任务多分类问题基本形式一般向量形式:f(x)=ωT∗x+bf(\boldsymbol{x})=\boldsymbol{\omega}^T*\boldsymbol{x}+bf(x)=ωT∗x+b优点:非线性模型可由
机器学习总结之——标准化与归一化的区别 Greatpanc 机器学习标准化归一化标准化与归一化过程缺失数据处理
机器学习总结之——标准化与归一化的区别1、标准化简单来说，标准化是依照特征矩阵的列处理数据，其通过求z-score的方法，将样本的特征值转换到同一量纲下。标准化的前提是特征值服从正态分布，标准化后，其转换成标准正态分布。公式如下：x′=x−XS（其中X代表样本均值，S代表样本方差）x'=\frac{x-X}{S}（其中X代表样本均值，S代表样本方差）x′=Sx−X（其中X代表样本均值
李宏毅课程-机器学习总结张学义深度学习
李宏毅课程-机器学习总结迁移学习：TransferLearning1.什么是迁移学习呢？2.为什么用迁移学习3.迁移学习的概述3.1第一类迁移学习3.2第二类迁移学习3.3第三类迁移学习3.4第四类迁移学习大佬的笔记较好，拷贝留档学习学习网址https://aistudio.baidu.com/aistudio/education/group/info/1978迁移学习：TransferLearn
机器学习总结一：Bagging之决策树、随机森林原理与案例想考个研机器学习决策树随机森林
机器学习算法总结一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-means一、Bagging之决策树、随机森林原理与案例1.决策树1.1简介决策树(DecisionTree)是一种非参数的有监督学习方法，它能够从一系列有特征和标签的数据种总结出决策规则，并利用树状图结构呈现这些规则
机器学习总结三：SVM原理推导与案例想考个研机器学习支持向量机算法
机器学习算法总结一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-means三、SVM1.原理推导（硬间隔）1.1分类问题代数化**svm原理一句话概括：找出一个最优的直线(或超平面)去隔离不同类别样本数据，达到分类目的。**图1图2图1:找出一条直线将样本完美地划分成两类（注意这样
机器学习总结二：boosting之GBDT、XGBT原理公式推导想考个研机器学习算法 boosting
一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-meansBoosting1.简介通过在数据上构建多个弱评估器，汇总所有弱评估器的建模结果，以取得比单个模型更好的分类或回归表现。加法模型，前向分步计算学习。2.基本元素弱评估器f(x)：一般为决策树(cart树)，不同boostin
机器学习总结四：逻辑回归与反欺诈检测案例想考个研机器学习逻辑回归算法
机器学习算法总结一、Bagging之决策树、随机森林原理与案例二、boosting之GBDT、XGBT原理推导与案例三、SVM原理推导与案例四、逻辑回归与反欺诈检测案例五、聚类之K-means四、逻辑回归1、概述由线性回归变化而来的，应用于分类问题中的广义回归算法。组成：回归函数z=w1x1+w2x2+...+wnxn+b=[w1w2wnb]∗[x1x2⋮xn1]=wTXz=w_1x_1+w_2x
吴恩达机器学习总结（二）——Logistic回归和简单的神经网络（附作业） Anaconda_ 机器学习机器学习逻辑回归神经网络
在线性回归模型中，输入和输出一般都是连续的，对于每个输入x，都有一个对应的输出y，模型的定义域和值域都可以是(−∞,+∞)(-∞,+∞)(−∞,+∞)。而对于分类模型来说，其输入可以是连续的，但它的输出是离散的，即只有有限个输出y。例如，其值域可以只有两个值{0,1}，这两个值可以表示对样本的某种分类，高/低、患病/健康、阴性/阳性等，这就是最常见的二分类问题。二、Logistic回归逻辑回归带有
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR