massquantity

支持向量机 (三)：优化方法与支持向量回归

拉格朗日乘子法 - KKT条件 - 对偶问题

支持向量机 (一)：线性可分类 svm

支持向量机 (二)：软间隔 svm 与核函数

支持向量机 (三)：优化方法与支持向量回归

优化方法

一、SMO算法

回顾支持向量机 (二) 中 $(1.7)$ 式最后要求解的优化问题：

\[ \begin{align} \max_\alpha &\;\; \sum\limits_{i=1}^m \alpha_i - \frac12 \sum\limits_{i=1}^m\sum\limits_{i=1}^m \alpha_i\alpha_jy_iy_j\boldsymbol{x}_i^{\top}\boldsymbol{x}_j \tag{1.1}\\[1ex] \text{s.t.} & \;\; \sum\limits_{i=1}^m \alpha_iy_i = 0 \tag{1.2} \\[1ex] & \;\; 0 \leqslant \alpha_i \leqslant C, \quad i = 1,2,\ldots m \tag{1.3} \end{align} \]

在求出满足条件的最优 $\boldsymbol{\alpha}$ 后，即可得 svm 模型的参数 $(\boldsymbol{w}, b)$ ，进而获得分离超平面。可以用通用的二次规划算法求解，该二次规划问题有 $m$ 个变量 ( $m$ 为样本数)， $(m+1)$ 项约束，所以当样本容量 $m$ 很大时，问题变得不可解，而本节介绍的 SMO（sequential minimal optimization）算法就是高效求解上述问题的算法之一。

SMO 算法将原来非常大的二次规划问题分解成了一系列非常小的可解的二次规划问题。SMO 算法最诱人的地方在于，这些分解后小的二次规划问题，都是拥有解析解的，也就是说，求解这些小的二次规划优化问题不需要通过非常耗时的循环来得到问题的结果。由于不需要矩阵计算，使得 SMO 算法在实际的数据集的测试中，其计算复杂度介于线性复杂度和二次复杂度之间。SMO 算法的计算复杂度和 svm 的模型也有关系，比如线性核 svm 计算速度较快。在实际测试中发现，如果训练样本是稀疏数据集，那么SMO 算法的效率会极其高。

SMO算法的基本思路是：选择两个变量 $\alpha_1$和 $\alpha_2$ ，固定其他所有 $\alpha_i(i =3\ldots m)$，仅针对这两个变量构建二次规划问题，这样就比原来复杂的优化问题简化很多。由于有约束条件 $\sum\limits_{i=1}^m \alpha_iy_i = 0$ ，固定了其他 $\alpha_i(i =3\ldots m)$ 后，可得 $\alpha_1 y_1 + \alpha_2 y_2 = - \sum\limits_{i=3}^m \alpha_iy_i$ 。所以 $\alpha _1$ 确定后，$\alpha _2$ 即可自动获得，则该小型二次规划问题中的两个变量会同时更新，接着再不断选取新的变量进行优化。

如何在每一步选择合适的 $\alpha$ 进行优化？ SMO 采用启发式的变量选择方法：第 1 个变量 $\alpha_1$ ，一般选择训练样本中违反 KKT 条件最严重的样本点所对应的 $\alpha$ 。而第 2 个变量 $\alpha_2$ 则选取与 $\alpha_1$ 的样本点之间间隔最大的样本点对应的 $\alpha$ ，这样二者的更新往往会给目标函数带来更大的变化。这里的 KKT 条件具体指的是：

\[ \begin{aligned} \alpha_i=0 & \quad\Longleftrightarrow\quad y_if(\boldsymbol{x}_i) \ge 1\\ 0<\alpha_i

其中 $f(\boldsymbol{x}_i) = \boldsymbol{w}^\top \boldsymbol{x}_i + b = \sum\limits_{j=1}^m \alpha_jy_j \boldsymbol{x}_i^\top \boldsymbol{x}_j + b$ 。还有一点就是，由于 KKT 条件过于地严格，比如 $y_if(\boldsymbol{x}_i) = 1$ ，这个条件一般很难达到，所以在检验 KKT 条件的时候，都是在一定的误差范围 $\epsilon $ 内检验 KKT 条件的，即 $|y_if(\boldsymbol{x}_i) - 1| < \epsilon$ 。

在选择了合适的变量后，下面来看如何解 $\alpha_1$ 和 $\alpha_2$：

若不考虑约束项 $(1.2)$ 和 $(1.3)$ ，由于固定了其他所有 $\alpha_i(i =3\ldots m)$ ，因此设 $\alpha_1 y_1 + \alpha_2 y_2 = - \sum\limits_{i=3}^m \alpha_iy_i = \zeta$ ，利用 $y_i^2 = 1$ 两边同乘以 $y_1$ ，则 $\alpha_1 = (\zeta - \alpha_2 y_2) y_1$ ，代入 $(1.1)$ 式并求导即可得最优的 $\alpha_2$ ，继而利用上式求得 $\alpha_1$ 。

然而由于约束项 $(1.3)$ 的存在，$\alpha_1$ 和 $\alpha_2$ 必须位于 $[0, C] \times [0, C]$ 围成的矩形区域内；且由于约束项 $(1.2)$ 的存在， $\alpha_1 y_1 + \alpha_2 y_2 = - \sum\limits_{i=3}^m \alpha_iy_i = \zeta$ ，又由于 $y_1$, $y_2$ 只能取 $+1$ 和 $-1$ ，所以在第一种情况 —— $y_1$ 和 $y_2$ 异号时，$\alpha_1$ 和 $\alpha_2$ 位于直线 $\alpha_1 - \alpha_2 = \zeta$ 上 (这里取 $y_1 = 1, \;y_2 = -1$ ，反过来情况类似)，如下图：

这里采用迭代优化，假设上一轮迭代得到的最优解是 $\alpha_1^{\,old}$ 和 $\alpha_2^{\,old}$，本轮迭代完成后的解为 $\alpha_1^{\,new}$ 和 $\alpha_2^{\,new}$。由于要满足约束条件，$\alpha_2^{\,new}$ 存在下界 $L$ 和上界 $H$ ，即： $L \leqslant \alpha_2^{\,new} \leqslant H$ 。

假设要求 $\alpha_2$ 的最小值，从图中可以看到只有当 $\alpha_1 = 0$ 时，$\alpha_2$ 可以在矩形区域内的直线 $\alpha_1 - \alpha_2 = \zeta$ 上取得最小值。此时 $\alpha_2^{\,new} = -\zeta = \alpha_2^{\,old} - \alpha_1^{\,old}$ ( 后面一个等式是因为 $\zeta$ 是常数 ) ，从图中也显示红线和绿线与 $y$ 轴都相交于 $(0, -\zeta)$ ，然而由于约束 $0 \leqslant \alpha_2 \leqslant C$ 的存在，图中绿线的下端点只能取到 $(\zeta, 0)$ ，所以综合这两种情况 $\alpha_2$ 的下界 $L = \max(0, \, -\zeta) = \max(0, \,\alpha_2^{\,old} - \alpha_1^{\,old})$ 。

同理要求 $\alpha_2$ 的最大值，只有当 $\alpha_1 = C$ 时，$\alpha_2$ 可以在矩形区域内的直线 $\alpha_1 - \alpha_2 = \zeta$ 上取得最大值。红线和绿线与 $y$ 轴都相交于 $(C, C-\zeta)$ ，然而由于约束 $0 \leqslant \alpha_2 \leqslant C$ 的存在，图中红线的上端点只能取到 $(C + \zeta, C)$ ，所以综合下来 $\alpha_2$ 的上界 $H = \min(C, \, C - \zeta) = \min(C, \, C + \alpha_2^{\,old} - \alpha_1^{\,old})$ 。

第二种情况 —— $y_1$ 和 $y_2$ 同号时，$\alpha_1$ 和 $\alpha_2$ 位于直线 $\alpha_1 + \alpha_2 = \zeta$ 上 (这里取 $y_1 = 1, \;y_2 = 1$ ，反过来情况类似)，如下图：

假设要求 $\alpha_2$ 的最小值，从图中可以看到只有当 $\alpha_1 = C$ 时，$\alpha_2$ 可以在矩形区域内的直线 $\alpha_1 + \alpha_2 = \zeta$ 上取得最小值。此时 $\alpha_2^{\,new} = \zeta - C = \alpha_1^{\,old} + \alpha_2^{\,old} - C$ ，从图中也显示红线和绿线与 $y$ 轴都相交于 $(C, \zeta - C)$ ，然而由于约束 $0 \leqslant \alpha_2 \leqslant C$ 的存在，图中绿线的下端点只能取到 $(\zeta, 0)$ ，所以综合这两种情况 $\alpha_2$ 的下界 $L = \max(0, \, \zeta - C) = \max(0, \, \alpha_1^{\,old} + \alpha_2^{\,old} - C)$ 。

同理要求 $\alpha_2$ 的最大值，只有当 $\alpha_1 = $0 时，$\alpha_2$ 可以在矩形区域内的直线 $\alpha_1 + \alpha_2 = \zeta$ 上取得最大值。红线和绿线与 $y$ 轴都相交于 $(0, \zeta)$ ，然而由于约束 $0 \leqslant \alpha_2 \leqslant C$ 的存在，图中红线的上端点只能取到 $(\zeta-C, \, C)$ ，所以综合下来 $\alpha_2$ 的上界 $H = \min(C, \, \zeta) = \min(C, \, \alpha_1^{\,old} + \alpha_2^{\,old})$ 。

于是在 $L \leqslant \alpha_2^{\,new} \leqslant H$ 的约束范围内求得 $\alpha_2^{\,new}$ 后，继而从 $\alpha_1 y_1 + \alpha_2 y_2 = - \sum\limits_{i=3}^m \alpha_iy_i = \zeta$ 中求得 $\alpha_1^{\,new}$ ，这样 $\alpha_1$ 和 $\alpha_2$ 就同时得到了更新。接下来不断选择变量进行优化，当所有 $\alpha_i$ 都满足 KKT 条件时，算法终止，求得了最优的 $\alpha_i , \;\; i = 1,2,\ldots m$ 。

二、Hinge Loss 梯度下降

svm 使用的损失函数为 hinge loss，即为：
\[ L(y,f(x)) = max(0,1-yf(x)) \]

$\text{hinge loss}$ 使得 $yf(x)>1$ 的样本损失皆为 0，由此带来了稀疏解，使得 svm 仅通过少量的支持向量就能确定最终超平面。下面来看 hinge loss 是如何推导出来的，支持向量机 (二) 中 $(1.1)$ 式带软间隔的 svm 最后的优化问题为：
\[ \begin{align} \min\limits_{\boldsymbol{w}, b,\boldsymbol{\xi}} & \;\; \frac12 ||\boldsymbol{w}||^2 + C \,\sum\limits_{i=1}^m \xi_i \tag{1.4}\\[1ex] {\text { s.t. }} & \;\; y_{i}\left(\boldsymbol{w}^{\top} \boldsymbol{x}_{i}+b\right) \geq 1 - \xi_i, \quad i=1,2, \ldots, m \tag{1.5} \\[1ex] & \;\; \xi_i \geq 0, \quad i=1,2, \ldots m \tag{1.6} \end{align} \]

$(1.5)$ 式重新整理为 $ \xi_i \geqslant 1 - y_i(\boldsymbol{w}^\top\boldsymbol{x}_i + b)$ 。若 $1 - y_i(\boldsymbol{w}^\top\boldsymbol{x}_i + b) < 0$ ，由于约束$(1.6)$ 的存在，则 $\xi_i \geqslant 0$ ；若$1 - y_i(\boldsymbol{w}^\top \boldsymbol{x}_i + b) \geqslant 0$ ，则依然为 $ \xi_i \geqslant 1 - y_i(\boldsymbol{w}^\top \boldsymbol{x}_i + b)$ 。所以$(1.5),\,(1.6)$ 式结合起来：
\[ \xi_i \geqslant \max(0,\, 1 - y_i(\boldsymbol{w}^\top \boldsymbol{x}_i + b)) = \max(0,\, 1-y_if(x_i)) \]
又由于 $(1.4)$ 式是最小化问题，所以取 $\xi_i$ 的极小值，即令 $\xi_i = \max(0,1-yf(x))$ 代入 $(1.4)$ 式，并令$\lambda = \frac{1}{2C}$ ：
\[ \min \left(C\sum\limits_{i=1}^m \max(0,\, 1-y_if(x_i)) + \frac12 ||\boldsymbol{w}||^2\right) \quad {\large \propto} \quad \min \left( \sum\limits_{i=1}^m \underbrace{\max(0,\, 1-y_if(x_i))}_{hinge \; loss} + \lambda ||\boldsymbol{w}||^2 \right) \]

svm 中最常用的优化算法自然是上文中的 SMO 算法，不过有了损失函数后也可以直接优化。由于 hinge loss 在 $y_i(\boldsymbol{w}^T\boldsymbol{x}_i + b) = 1$ 处不可导，因而无法直接使用梯度下降，不过可以通过求次梯度 (subgradient) 来进行优化：

\[ \begin{align*} \frac{\partial L}{\partial \boldsymbol w} &= \begin{cases} -y_i \cdot\boldsymbol x_i & \text{if} \;\; y_i(\boldsymbol{w}^\top\boldsymbol{x}_i + b) < 1 \\[1ex] 0 & \text{otherwise} \end{cases} \\[2ex] \frac{\partial{L}}{\partial b} &= \begin{cases} -y_i \quad & \quad\text{if} \;\; y_i(\boldsymbol{w}^\top\boldsymbol{x}_i + b) < 1 \\[1ex] 0 & \quad \text{otherwise} \end{cases} \\[2ex] \boldsymbol{w} &= \boldsymbol{w} - \eta \, \frac{\partial L}{\partial \boldsymbol{w}} \\ b &= b - \eta \, \frac{\partial L}{\partial b} \end{align*} \]

支持向量回归

前文主要叙述支持向量机用于分类问题，当然其也可用于回归问题。给定一组数据 $\left\{\left(\boldsymbol{x}_{1}, y_{1}\right),\left(\boldsymbol{x}_{2}, y_{2}\right), \ldots,\left(\boldsymbol{x}_{m}, y_{m}\right)\right\}$ ，其中 $\boldsymbol{x}_i \in \mathbb{R}^d$ ，$y_i \in \mathbb{R}$ ，回归问题希望学得一个模型 $f(\boldsymbol{x}) = \boldsymbol{w}^\top \boldsymbol{x} + b$ ，使得 $f(\boldsymbol{x})$ 与 $y$ 尽可能接近。传统的回归模型通常基于模型输出 $f(\boldsymbol{x})$ 与真实输出 $y$ 之间的差别来计算损失。当且仅当 $f(\boldsymbol{x})$ 与 $y$ 完全相同时，损失才为零。支持向量回归 ( Support Vector Regression，以下简称 $\text{svr}$ ) 与之不同，它假设能容忍 $f(\boldsymbol{x})$ 与 $y$ 之间最多有 $\epsilon$ 的偏差，即仅当 $|f(\boldsymbol{x}) - y| > \epsilon$ 时，才计算损失。如下图所示，$\text{svr}$ 相当于以 $f(\boldsymbol{x})$ 为中心，构建了一个宽度为 $\epsilon$ 的间隔带。若训练样本落在此间隔带内则被认为是预测正确的。

$\text{svr}$ 的损失函数由此被称为 $\epsilon - \text{insensitive error}$ ，形如：
\[ L(y,f(x)) = \begin{cases} 0 \;\;& \text{if}\;\; |y - f(x)| \leq \epsilon\\ |y - f(x)| - \epsilon \;\; & \text{otherwise} \end{cases} \tag{2.1} \]

本质上我们希望所有的模型输出 $f(x)$ 都在 $\epsilon$ 的间隔带内，因而与支持向量机 (一) 中的 $(1.3)$ 式一样，我们可以定义 $\text{svr}$ 的优化目标：
\[ \begin{aligned} & \min\limits_{\boldsymbol{w}, b}\frac12 ||\boldsymbol{w}||^2 \\[1ex] & {\text { s.t. }} \;\; |y_{i} - \boldsymbol{w}^{\top} \boldsymbol{x}_{i} - b| \leq \epsilon , \quad i=1,2, \ldots, m \end{aligned} \tag{2.2} \]

同样类似于支持向量机 (二) 中的 $(1.1)$ 式，可以为每个样本点引入松弛变量 $\xi > 0$，即允许一部分样本落到间隔带外，使得模型更加 robust 。由于这里用的是绝对值，实际上是两个不等式，也就是说两边都需要松弛变量，我们定义为 $\xi_i^{\lor}, \xi_i^{\land}$ ，于是优化目标变为：
\[ \begin{align*} \min\limits_{\boldsymbol{w}, b,\boldsymbol{\xi^\lor},\boldsymbol{\xi^\land}}\;\; &\frac{1}{2}||\boldsymbol{w}||^2 + C\sum\limits_{i=1}^{m}(\xi_i^{\lor}+ \xi_i^{\land}) \\[1ex] \text{s.t.} \;\; &-\epsilon - \xi_i^{\lor} \leq y_i - \boldsymbol{w}^\top \boldsymbol{x}_i -b \leq \epsilon + \xi_i^{\land} \\[1ex] & \xi_i^{\lor} \geq 0, \; \xi_i^{\land} \geq 0\quad i=1,2, \ldots, m \end{align*} \tag{2.3} \]

上式中的 $C$ 和 $\epsilon$ 分别对应 scikit-learn 的 SVR 中的参数 $C$ 和 $\text{epsilon}$ ，$C$ 越大，意味着对离群点的惩罚就越大，最终就会有较少的点跨过间隔边界，模型也会变得复杂。而 $C$ 设的越小，则较多的点会跨过间隔边界，最终形成的模型较为平滑。而 $\text{epsilon}$ 越大，则对离群点容忍度越高，最终的模型也会较为平滑，这个参数是 $\text{svr}$ 问题中独有的，svm 中没有这个参数。

对于 $(2.3)$ 式，为每条约束引入拉格朗日乘子 $\mu_i^{\lor} \geqslant 0, \, \mu_i^{\land} \geqslant 0,\, \alpha_i^{\lor} \geqslant 0, \,\alpha_i^{\land} \geqslant 0$ ：
\[ \begin{align*} L(\boldsymbol{w},b,\boldsymbol{\alpha^{\lor}}, \boldsymbol{\alpha^{\land}}, \boldsymbol{\xi^{\lor}}, \boldsymbol{\xi}^{\land}, \boldsymbol{\mu}^{\lor}, \boldsymbol{\mu}^{\land}) = &\frac{1}{2}||\boldsymbol{w}||^2 + C\sum\limits_{i=1}^{m}(\xi_i^{\lor}+ \xi_i^{\land}) + \\ &\sum\limits_{i=1}^{m}\alpha_i^{\lor}(-\epsilon - \xi_i^{\lor} -y_i + \boldsymbol{w}^\top \boldsymbol{x}_i + b) + \\ & \sum\limits_{i=1}^{m}\alpha_i^{\land}(y_i - \boldsymbol{w}^\top \boldsymbol{x}_i - b -\epsilon - \xi_i^{\land}) - \\ & \sum\limits_{i=1}^{m}\mu_i^{\lor}\xi_i^{\lor} - \sum\limits_{i=1}^{m}\mu_i^{\land}\xi_i^{\land} \end{align*} \tag{2.4} \]

其对偶问题为：
\[ \begin{aligned} \max_{\boldsymbol{\alpha}, \boldsymbol{\mu}}\min_{\boldsymbol{w},b,\boldsymbol{\xi}} &\;\; L(\boldsymbol{w},b,\boldsymbol{\alpha^{\lor}}, \boldsymbol{\alpha^{\land}}, \boldsymbol{\xi^{\lor}}, \boldsymbol{\xi}^{\land}, \boldsymbol{\mu}^{\lor}, \boldsymbol{\mu}^{\land}) \\[1ex] \text{s.t.} &\;\; \alpha_i^{\lor}, \, \alpha_i^{\land} \geq 0, \quad i=1,2, \ldots m \\[1ex] & \;\;\mu_i^{\lor},\, \mu_i^{\land} \geq 0, \quad i = 1,2, \ldots m \end{aligned} \tag{2.5} \]

上式对 $\boldsymbol{w}, b, \xi_i^\lor, \xi_i^\land$ 求偏导为零可得：
\[ \begin{align} \frac{\partial L}{\partial \boldsymbol{w}} = \boldsymbol{0} & \implies \boldsymbol{w} = \sum\limits_{i=1}^m (\alpha_i^\land - \alpha_i^\lor) \boldsymbol{x}_i \qquad\qquad \tag{2.6} \\ \frac{\partial L}{\partial b} = 0 & \implies \sum\limits_{i=1}^m (\alpha_i^\land - \alpha_i^\lor) = 0 \qquad\qquad\quad\; \tag{2.7} \\ \frac{\partial L}{\partial \boldsymbol{\xi}^\lor} = 0 & \implies C - \alpha_i^\lor - \mu_i^\lor = 0 \qquad\qquad\quad\; \tag{2.8} \\ \frac{\partial L}{\partial \boldsymbol{\xi}^\land} = 0 & \implies C - \alpha_i^\land - \mu_i^\land = 0 \qquad\qquad\quad\; \tag{2.9} \end{align} \]

将 $(2.6) \sim (2.9)$ 式代入 $(2.4)$ 式，并考虑由$(2.8), \,(2.9)$ 式得 $C - \alpha_i = u_i \geqslant 0$ ，因而 $0 \leqslant \alpha_i \leqslant C$ 得化简后的优化问题：
\[ \begin{aligned} \max_{\boldsymbol{\alpha}^\lor, \boldsymbol{\alpha}^\land} &\;\; \sum\limits_{i=1}^m y_i(\alpha_i^\land - \alpha_i^\lor) - \epsilon(\alpha_i^\land + \alpha_i^\land) - \frac12 \sum\limits_{i=1}^m\sum\limits_{j=1}^m (\alpha_i^\land - \alpha_i^\lor)(\alpha_j^\land - \alpha_j^\lor)\boldsymbol{x}_i^{\top}\boldsymbol{x}_j \\[1ex] \text{s.t.} & \;\; \sum\limits_{i=1}^m (\alpha_i^\land - \alpha_i^\lor) = 0 \\[1ex] & \;\; 0 \leqslant \alpha_i^\lor, \alpha_i^\land \leqslant C, \quad i = 1,2,\ldots m \end{aligned} \tag{2.10} \]

上述求最优解的过程需满足 $\mathbb{KKT}$ 条件，其中的互补松弛条件为：
\[ \begin{cases} \alpha_i^{\lor}(\epsilon + \xi_i^{\lor} + y_i - \boldsymbol{w}^\top \boldsymbol{x}_i - b ) = 0 \qquad\qquad\qquad\qquad\qquad (2.11) \\[2ex] \alpha_i^{\land}(\epsilon + \xi_i^{\land} - y_i + \boldsymbol{w}^\top \boldsymbol{x}_i + b ) = 0 \qquad\qquad\qquad\qquad\qquad (2.12) \\[2ex] \mu^\lor_i \xi^\lor_i = (C - \alpha^\lor_i)\xi^\lor_i = 0 \qquad\qquad\qquad\qquad\qquad\qquad\quad\;\; (2.13) \\[2ex] \mu^\land_i \xi^\lor_i = (C - \alpha^\land_i)\xi^\land_i = 0 \qquad\qquad\qquad\qquad\qquad\qquad\quad\;\; (2.14) \end{cases} \]

若样本在间隔带内，则 $\xi_i = 0$ ， $| y_i - \boldsymbol{w}^\top \boldsymbol{x} - b| < \epsilon$ ，于是要让互补松弛成立，只有使 $\alpha_i^{\lor} = 0, \,\alpha_i^{\land} = 0$ ，则由 $(2.6)$ 式得 $\boldsymbol{w} = 0$ ，说明在间隔带内的样本都不是支持向量，而对于间隔带上或间隔带外的样本，相应的 $\alpha_i^\lor$ 或 $\alpha_i^\land$ 才能取非零值。此外一个样本不可能同时位于 $f(\boldsymbol{x})$ 的上方和下方，所以 $(2.11)$ 和 $(2.12)$ 式不能同时成立，因此 $\alpha_i^{\lor}$ 和 $\alpha_i^\land$ 中至少一个为零。

优化问题 $(2.10)$ 同样可以使用二次规划或 SMO 算法求出 $\boldsymbol{\alpha}$ ，继而根据 $(2.6)$ 式求得模型参数 $\boldsymbol{w} = \sum_{i=1}^m (\alpha_i^\land - \alpha_i^\lor) \boldsymbol{x}_i$ 。而对于模型参数 $b$ 来说，对于任意满足 $0 < \alpha_i < C$ 的样本，由 $(2.13)$ 和 $(2.14)$ 式可得 $\xi _i= 0$ ，进而根据 $(2.11)$ 和 $(2.12)$ 式：
\[ b = \epsilon + y_i - \boldsymbol{w}^\top\boldsymbol{x}_i = \epsilon + y_i - \sum\limits_{j=1}^m (\alpha_j^\land - \alpha_j^\lor) \boldsymbol{x}_j^\top \boldsymbol{x}_i \]

则 $\text{svr}$ 最后的模型为：
\[ f(\boldsymbol{x}) = \boldsymbol{w}^\top \boldsymbol{x} + b = \sum\limits_{i=1}^m (\alpha_i^\land - \alpha_i^\lor) \boldsymbol{x}_i^\top \boldsymbol{x} + b \]

支持向量机算法总结

支持向量机的优点：

解决高维特征的分类问题和回归问题很有效,在特征维度大于样本数时依然有很好的效果。
仅仅使用一部分样本决定超平面，内存占用少。
有大量的核函数可以使用，从而可以很灵活的来解决各种非线性的分类回归问题。

支持向量机的缺点：

当采用核函数时，如果需要存储核矩阵，则空间复杂度为 $\mathcal{O}(m^2)$ 。
选择核函数没有通用的标准 (当然其实是有的，见下文~) 。
样本量很大时，计算复杂度高。

对于第 3 个缺点，scikit-learn 的 SVC 文档中有一句话：

The fit time scales at least quadratically with the number of samples and may be impractical beyond tens of thousands of samples.

我特意去查了下字典，”tens of thousands“ 意为 ”好几万“，也就是说对于几万的数据 svm 处理起来就已经很捉急了，至于百万到亿级的数据基本就不用想了，这在如今这个大数据时代确实不够看，不过这里说的是使用核函数的 svm。而对于线性 svm 来说，情况要好很多，一般为 $\mathcal{O}(m)$。

LibSVM 的作者，国立台湾大学的林智仁教授在其一篇小文（A Practical Guide to Support Vector Classification）中提出了 svm 库的一般使用流程 :

其中第二步 scaling 对于 svm 的整体效果有重大影响。主要原因为在没有进行 scaling 的情况下，数值范围大的特征会产生较大的影响，进而影响模型效果。

第三步中认为应优先试验 RBF 核，通常效果比较好。但他同时也提到，RBF 核并不是万能的，在一些情况下线性核更加适用。当特征数非常多，或者样本数远小于特征数时，使用线性核已然足够，映射到高维空间作用不大，而且只要对 C 进行调参即可。虽然理论上高斯核的效果不会差于线性核，但高斯核需要更多轮的调参。

下表总结了 scikit-learn 中的 svm 分类库：

scikit-learn 中 svm 库的两个主要超参数为 $C$ 和 $\gamma$ ，$C$ 和 $\gamma$ 越大，则模型趋于复杂，容易过拟合；反之，$C$ 和 $\gamma$ 越大，模型变得简单，如下图所示：

computed()、watch() 与 watchEffect() 前端岳大宝前端框架Vue vue.js javascript 前端
下面，我们来系统的梳理关于computed、watch与watchEffect的基本知识点：一、核心概念与响应式基础1.1响应式依赖关系Vue的响应式系统基于依赖收集和触发更新的机制：响应式数据依赖收集创建依赖关系数据变更触发更新执行副作用1.2三大API对比特性computedwatchwatchEffect返回值Ref对象停止函数停止函数依赖收集自动手动指定自动执行时机惰性求值响应变化立即执行
ref() 与 reactive() 前端岳大宝前端框架Vue javascript 前端 vue.js
下面，我们来系统的梳理关于ref()与reactive()的基本知识点：一、响应式编程核心概念1.1什么是响应式编程？响应式编程是一种声明式编程范式，它使数据变化能够自动传播到依赖它的代码部分。在Vue中，响应式系统实现了：数据驱动视图：数据变化自动更新DOM依赖追踪：自动跟踪数据依赖关系高效更新：最小化不必要的DOM操作1.2Vue响应式系统演进版本响应式实现特点Vue2Object.defin
用 Python 开发文字冒险游戏：从零开始的教程晓天天天向上 python microsoft 开发语言
文字冒险游戏(Text-basedAdventureGame)是一种经典的游戏类型，玩家通过输入文字指令与游戏世界互动。这种游戏不依赖复杂的图形界面，非常适合初学者学习编程逻辑和用户交互。在本篇博客中，我们将用Python开发一个简单的文字冒险游戏，体验游戏开发的乐趣。1.游戏设计思路游戏背景玩家醒来发现自己身处一个神秘的地下城，需要探索房间、收集物品、战胜敌人并找到出口。核心机制房间导航：玩家可
稳定币独角兽：Circle InnoLink_1024 区块链稳定币区块链
Circle公司背景分析CircleInternetFinancial（以下简称Circle）是一家成立于2013年的美国金融科技公司，总部位于波士顿，由JeremyAllaire和SeanNeville联合创立。公司最初专注于点对点加密货币支付和交易，后转型为全球领先的稳定币发行机构，其核心产品是与美元1:1挂钩的USDCoin（USDC），目前为全球第二大稳定币，仅次于Tether的USDT。
2025 VUE常见面试题 hmildj vue.js 面试前端
前言总结一些VUE面试的基础知识，共同学习1.什么是Vue？答案：Vue.js（通常简称为Vue）是一个用于构建用户界面的‌渐进式JavaScript框架，Vue3是Vue.js框架的最新版本，它引入了许多改进和优化，包括性能提升、更好的类型支持、组合API等。2.MVVM模式是什么？Vue如何体现这一模式？‌答案：MVVM将视图（View）与数据（Model）通过ViewModel层解耦，Vue
RPC：跨越代码与硅晶的“握手”——你每天都在用，却可能从未真正理解它老马爱知信息技术 #分布式计算 rpc 网络协议网络分布式系统微服务软件架构硬核科普
——从本地调用的幻觉到服务万物的底座，解析这个支配云原生时代的隐形协议引言：一个程序员的日常困境想象一下这个场景：你正在构建一个电商系统。用户服务（管理用户信息）在一台服务器上，订单服务在另一台，而支付服务，则由远在天边的第三方提供。当一个用户下单时，订单服务需要先向用户服务确认用户身份，再调用支付服务完成扣款。这三个服务如同三座孤岛，如何让它们高效、优雅地对话？难道你要手动编写Socket连接，
Vue 3 的＜script setup＞语法糖与 TypeScript 的深度整合前端熊猫 vue.js typescript script 前端
在Vue单文件组件中，标签除了lang、async、defer、src和name属性外，还有一些其他重要属性和用法值得关注。以下是补充说明及优化建议：一、setup属性（CompositionAPI核心）作用：通过setup属性启用Vue3的CompositionAPI，简化逻辑组织和复用。代码示例：import{ref,onMounted}from'vue'constcount=ref(0)on
《现代通信原理与技术》模拟调制与解调—FM 调制实验报告不想秃头的程序人工智能 matlab 信息与通信信号处理
摘要本实验旨在通过MATLAB软件进行模拟调制与解调的实践，加深对频率调制（FrequencyModulation,FM）原理的理解，并掌握FM调制与解调的实现方法。关键词：MATLAB引言在现代通信系统中，调制技术是实现信息传输的核心方法之一。频率调制（FrequencyModulation,FM）作为一种重要的模拟调制方式，通过改变载波信号的频率来传递信息，广泛应用于广播、电视、无线通信等领域
平台再升级！接入DeepSeek AI，三大能力一键生成橙武科技低代码 AI deepseek 人工智能
在数字化项目落地过程中，很多企业都会面临相同的问题：数据库建模要写SQL表结构；业务流程需要画LogicFlow流程图；前端页面还要写AMISJSON配置。从想法到实现，中间至少要经历产品经理、架构师、后端、前端多轮沟通。每个环节都耗时，改起来还要推翻重来。demo地址：https://admin.cwcode.top✨我们的平台，现在直接整合了DeepSeekAI大模型只要输入一句需求，就能：✅
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
AI助力基因遗传疾病检测：现状与未来 t0_54program 大数据与人工智能人工智能个人开发
在现代医学领域，与基因紊乱相关疾病的早期检测至关重要。像肺癌，早期诊断的患者5年生存率可达57%，而四期癌症患者生存率仅3%。阿尔茨海默病的早期检测，能让患者改变生活方式、参与临床试验并提前治疗脑部退化症状，有效延长生命。尽管基因检测对评估晚发性阿尔茨海默病的可能性有帮助，对早发性阿尔茨海默病也有指示作用，但其检测技术仍有待完善。目前，仅基于生物学研究的疾病检测技术多样，虽对特定病例精确，但通常需
1.2 Python 的特点与优势 Utopia Reverie python python 开发语言
1.语法简洁易读Python以简洁的语法著称，代码可读性强，减少了不必要的符号和冗余代码。例如，使用缩进来表示代码块，而非传统的大括号。这使得代码更易于理解和维护，尤其适合初学者。示例：python运行【#计算斐波那契数列的前10项n=10a,b=0,1for_inrange(n);print(a,end='')a,b=b,a+b#输出:0112358132134】2.开源与社区支持Python是
＜script setup＞语法糖前端岳大宝前端框架Vue vue.js 前端 javascript
下面，我们来系统的梳理关于Vue3语法糖的基本知识点：一、核心概念1.1什么是？是Vue3中CompositionAPI的编译时语法糖，它通过简化组件声明方式，显著减少样板代码，提供更符合直觉的开发体验。1.2设计目标与优势目标实现方式优势减少样板代码自动暴露顶层绑定代码更简洁提升开发体验更自然的响应式写法开发更高效更好的类型支持原生TypeScript集成类型安全编译时优化编译阶段处理运行时更高
FastJSON 解析错误分析与解决方案小屁孩大帅-杨一凡服务器 linux 前端运维
常见原因及解决方案1.数据为空或非JSON格式原因：输入数据可能为空字符串、null或其他非JSON格式内容。解决方案：在解析前检查数据是否有效。if(jsonStr!=null&&!jsonStr.trim().isEmpty()){//检查是否以JSON对象或数组的符号开头if(jsonStr.trim().startsWith("{")||jsonStr.trim().startsWith(
2025 最新【中兴通讯】投资价值分析报告 AI天才研究院计算 ai 价值投资
2025.3.28最新【中兴通讯】投资价值分析报告文章目录2025.3.28最新【中兴通讯】投资价值分析报告摘要一、公司概况与行业背景1.1公司基本架构1.2战略升级路径1.3行业发展趋势通信设备市场格局（2024年）技术迭代周期二、核心竞争力分析2.1技术壁垒2.2市场优势2.3供应链能力三、财务深度解析3.1关键指标趋势（单位：亿元）3.2资产负债表亮点3.3现金流质量四、风险与机遇评估4.1
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
CG-23H 超声波风速风向传感器--易风（加热型） sun15369027572 大数据
产品概述易风超声波风速风向传感器是一款基于超声波原理研发的风速风向测量仪器，利用发送的声波脉冲，测量接收端的时间或频率（多普勒变换）差别来计算风速和风向。该传感器可以同时测量风速，风向的瞬时数值，支持电流、电压信号输出以及RS485、NB-IoT、LoRa、4G及以太网等传输方式。整机外壳采用ABS材质，具有重量轻、没有移动部件、坚固实用的特点，而且不需维护和现场校准，能同时输出风速和风向。可以与
Unity脚本--01-脚本书写规则-脚本生命周期-脚本调试-常用API 秦果开发语言
一、脚本书写规则脚本：.cs的文本文件类文件作用：附加到游戏物体中，定义游戏对象行为指令的代码与C#类的区别：脚本只有字段和方法，没有自动属性和构造函数publicintA{get{returna;}set{a=value;}}属性定义了在unity中不会显示publicLifecycle(){Debug.Log("构造函数")//b=Time.time;}不要在脚本中写构造函数，因为不能在子线程
游戏研发高效利器：SVN资源动态项目管理解决方案还债大湿兄游戏项目管理
一、问题背景与解决方案传统资源分发痛点：人工打包耗时：平均每次版本发布需2小时版本隔离：不同团队无法同时使用多个版本资源冲突：美术/QA/策划资源版本不一致动态管理方案优势：二、系统核心流程//完整工作流控制器voidGameResourceManager::executeFullWorkflow(){//1.凭证验证if(!validateCredentials()){showError("认证
深入详解：决策树算法的概念、原理、实现与应用场景猿享天开算法决策树机器学习
深入详解：决策树算法的概念、原理、实现与应用场景决策树（DecisionTree）是机器学习中一种直观且广泛应用的监督学习算法，适用于分类和回归任务。其树形结构易于理解，特别适合初学者。本文将从概念、原理、实现到应用场景，全面讲解决策树，并通过流程图和可视化示例增强理解，通俗易懂，帮助小白快速掌握决策树算法相关知识。1.决策树的概念1.1什么是决策树？决策树通过一系列条件判断（决策节点）将输入数据
ArkTS与仓颉语言的深度解析（鸿蒙操作系统多设备）爱学习的小齐哥哥仓颉华为仓颉 HarmonyOS5
一、引言随着物联网和智能设备的飞速发展，多设备协同开发成为当前软件开发领域的重要课题。鸿蒙操作系统作为面向全场景的分布式操作系统，为开发者提供了ArkTS和仓颉语言两种强大的开发工具，助力实现高效的多设备应用开发。本文将全面剖析这两种语言在鸿蒙多设备开发中的应用，探讨其优势、开发环境、实现一次开发多端部署的方法以及在不同设备上的性能表现和适配策略，并结合智能驾驶应用场景进行实例分析。二、ArkTS
[学习] PID算法原理与实践（代码示例）极客不孤独学习算法 c语言
PID算法原理与实践文章目录PID算法原理与实践一、PID算法原理1.1PID算法概述1.定义2.应用领域3.核心目标1.2基本原理1.3数学表达离散化实现（适用于数字控制）二、实践案例（C语言）1.电机转速控制2.温度控制系统3.时钟驯服系统三、常见问题与优化1.积分饱和（Windup）问题2.噪声干扰问题3.非线性系统适配问题四、扩展方向1.数字PID与模拟PID的差异2.变参数PID（如增益
瑞芯微RK3506工业芯片实例方案解析：从架构到场景的深度实践淡远-九鼎创展科技架构嵌入式硬件人工智能电脑
一、芯片技术架构解析瑞芯微RK3506作为2024年第四季度推出的工业级MPU，采用三核Cortex-A7（1.5GHz）+单核Cortex-M0（200MHz）的异构架构，形成独特的"3+1"处理核心组合。这种设计通过AMP多核调度技术，实现了Linux、RTOS、Bare-metal系统的混合运行，典型配置如"2×A7运行Linux（HMI交互）+1×A7运行RTOS（协议处理）+M0裸机（实
Go Lang Fiber介绍技术的游戏 golang 开发语言后端
利用GoLangFiber进行高性能Web开发在不断发展的Web开发世界中，选择合适的框架至关重要。速度、简洁性和强大的功能集是每个开发者都追求的品质。在使用Go构建Web应用时，“Fiber”作为一个强大且轻量级的框架在众多选择中脱颖而出。在这份全面的指南中，我们将介绍GoLangFiber，涵盖其安装和设置，指导您创建一个基本的Fiber应用，并帮助您了解构成与Fiber进行Web开发旅程基础
✨【Blender/Houdini 渲染必看】CPUⓥⓢGPU？3 分钟选对算力不踩坑！渲染101专业云渲染 blender houdini 分布式服务器 maya
核心问题速答Q：渲染该选CPU还是GPU？✅CPU：复杂场景/批量渲染/预算可控首选✅GPU：单帧速度/实时预览/急单交付必选维度1：硬件硬刚——CPU凭啥赢麻了？▫️多线程王者：16核/32核服务器矩阵，支持50-300台并行渲染▫️场景兼容性：粒子特效/全局光照/超复杂模型稳定输出秘密武器：CPU批量渲染100帧耗时=GPU单帧耗时，整体效率持平！⚙️维度2：动态计费逻辑——成本由什么决定？计
【游戏技术分享第41期】鸿蒙游戏调用queryProducts接口返回报错1001860001，系统内部错误游戏技术分享鸿蒙游戏-技术分享 harmonyos 游戏华为
关键词IAPkit，鸿蒙，商品查询问题描述游戏集成了鸿蒙应用内支付服务，商品已在AGC后台配置，调用queryProducts接口返回系统内部错误：问题分析使用hdchilog>D:\hilog.txt命令行抓取系统全量日志，搜索IAPNAPI看到错误描述“notsupportiap”：看描述是不支持iap服务，优先从以下几点排查：agc后台是否打开应用内支付开关和激活支付协议；测试使用的华为账号
HarmonyOS NEXT仓颉开发语言实战案例：简约音乐播放页幽蓝计划开发语言 harmonyos
偶然间看到一个非常漂亮的音乐播放器设计图，忍不住想拿仓颉语言来练练手，当漂亮的设计图遇到优美的开发语言，简直是天作之合。看到这个页面，我们先做一个简单的分析。整个页面分为上中下三个部分，顶部为导航栏，底部是歌词工具栏，剩下的就是中间的歌曲信息和控制按钮部分。它们的部分方式是比较简单的纵向布局。页面大致结构代码如下：Column{//导航栏Stack{Text('NowPlaying').fontS
Unity知识点-Renderer常用材质变量徐子竣 unity 材质游戏引擎
本篇总结了Unity中renderer的3种常用的材质相关的变量：renderer.material,renderer.sharedMaterial,renderer.MaterialPropertyBlock。以及三者对SRPBatcher的影响。一.介绍及对比1.概念介绍1.material定义：material是Render组件（如MeshRenderer）的实例化材质。特点：访问rende
川翔云电脑全新上线：三维行业高效云端算力新选择渲染101专业云渲染电脑 houdini maya blender 3d 云计算
一、核心定位与优势云端虚拟工作站服务依托云端高性能CPU/GPU集群，提供远程桌面服务，支持普通设备运行专业软件。按需付费模式：无需采购高端硬件，大幅降低成本投入。生态协同优势：与渲染101同属母公司，可在云电脑中完成创作后一键提交至渲染101平台进行分布式渲染。二、硬件配置与性能参数CPU机型（侧重计算能力）GPU机型（图形渲染/AI训练）性能亮点支持最高8卡并联，显存叠加提升复杂场景处理能力。
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

支持向量机 (三)： 优化方法与支持向量回归

拉格朗日乘子法 - KKT条件 - 对偶问题

支持向量机 (一)： 线性可分类 svm

支持向量机 (二)： 软间隔 svm 与 核函数

支持向量机 (三)： 优化方法与支持向量回归

优化方法

一、SMO算法

二、Hinge Loss 梯度下降

支持向量回归

支持向量机算法总结

支持向量机的优点：

支持向量机的缺点：

你可能感兴趣的:(支持向量机 (三)： 优化方法与支持向量回归)

支持向量机 (三)：优化方法与支持向量回归

支持向量机 (一)：线性可分类 svm

支持向量机 (二)：软间隔 svm 与核函数

支持向量机 (三)：优化方法与支持向量回归

你可能感兴趣的:(支持向量机 (三)：优化方法与支持向量回归)