稚与

支持向量机——SVM原理

SVM——Support Vector Machine

5.11 update：拉格朗日对偶问题的推导
5.15 update：SMO算法推导
5.17 update：sklearn实现

文章目录

SVM——Support Vector Machine
- 简介
- 概念解释
- 基本原理
- - 简化约束条件
  - 对偶问题(dual problem)
  - 软间隔与松弛变量
  - 核函数
- 数学方法
- - 拉格朗日对偶转化
  - SMO算法(Sequential Minimal Optimization)
- SVM实现
- - 简单线性SVM
  - - 可视化训练集
    - SMO算法
    - 附数据集
  - sklearn实现线性SVM
  - 可视化比较线性核与高斯核

简介

支持向量机（support vector machines，SVM）是一种二分类模型，分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面。但是能将训练样本分开的划分超平面可能有很多，我们的目的就是找到两类训练样本“正中间”的划分超平面。其学习策略是使间隔最大化，最终转换为一个凸二次规划问题的求解。

概念解释

对于普通的SVM分类器，是借助超平面进行分类，故只适用于线性可分的情况。

线性可分性(linear separability)

给定一个数据集，如果存在超平面能将正实例点和负实例完全划分到超平面的两侧，则为线性可分；否则线性不可分。

线性可分模型举例：

线性不可分模型举例：

超平面(hyper plane)

超平面是由三维空间中的平面向高维推广的概念，其本质是自由度比空间维度小1的“平面”。自由度可以理解为超平面方程的自由变量，例如三维空间中，对于平面 $A x + B y + C z + D = 0$ （A、B、C、D已知），当x、y确定时z唯一确定，即x、y为自由变量，自由度为2。

在样本空间中，超平面用如下线性方程来表示： $w^Tx+b=0$ 其中 $\omega$ 是超平面的法向量， $b$ 为位移项。

直观理解，这个超平面应该是最适合分开两类数据的“平面”。而一种判断最合适的方法是使超平面两侧的数据到超平面的距离最大，即所谓的“间隔”最大。

间隔

对于二分类任务的SVM，将类别即为 ${-1,1\}$ 。学习目标是得到超平面 $w^T+b=0$ 将所有训练数据（线性可分时）分割到其两侧。显然 $w^T+b|$ 可以用于衡量数据点到超平面的距离。如果规定当 $w^T+b>0$ 时 $y$ 的类别为正，即取值为1，则对于任意的数据，我们可以用 $w^T+b$ 的符号来衡量数据点在超平面的哪一侧，同时通过判断与 $y$ 符号同或异来判断分类是否正确。即可以用 $y*(w^T+b)$ 的正负性表示数据的分类正确与否。

由此引出函数间隔： $\hat \gamma=y*(w^T+b)$ 。

但是用函数间隔去训练超平面有一个问题。在训练参数时，如果 $w$ 和 $b$ 等比例变化，会引起函数间隔的变化，但此时超平面保持不变。也就是说会产生“无效”的训练。

于是我们找到一种消除等比例变化的方法，即几何间隔：

$\hat \gamma=\frac{y*(w^Tx+b)}{||w||}$

其中 $∣ ∣ w ∣ ∣$ 是 $w$ 的L2范数（即欧式距离），当 $w\rightarrow kw,b\rightarrow kb$ 时， $||w||\rightarrow k||w||$ 。

对一个数据点进行分类，当超平面离数据点的“间隔”越大，分类的**置信度(confidence)**也越大。所以，为了使得分类的确信度尽量高，需要让所选择的超平面能够最大化几何间隔。最优的超平面就是最大几何间隔超平面。

故学习任务为 $\hat\gamma=max\ \hat\gamma_i$ 。

支持向量

样本空间中距离超平面最近的一个或多个点。如上图中的实心红点和空心红点。

基本原理

简化约束条件

最优化方法解决的是如何求出最优超平面的问题。

首先我们需要找到两类支持向量并求出几何间隔，相加后使间距和最大。取 $r=min\ r_i$ ，所以支持向量到超平面的距离为r，其他点到超平面的距离大于r。

这里有几个最小最大不好理解。用一句话说就是先确定超平面，找最小间隔对应的点，然后只考虑这个点（一个或多个），不断学习w、b。当然每次更新参数后需要重新计算支持向量。

于是有：

$\frac{y*(w^T+b)}{||w||} \geq r$

令 $∣ ∣ w ∣ ∣ * r = 1$ ，有

$y*(w^T+b)\geq 1$

这里是因为w和b可以等比例扩大而超平面不变，无论r是多少，我们都可以对w和b进行相应的变换，使 $∣ ∣ w ∣ ∣ * r = 1$ 。即 $r=\frac 1{||w||}$ 。

要使异类支持向量到超平面的距离和最大，即

$max_{w,b}\ \frac 2{||w||}\ \ \ \ s.t.\ y_i(w^Tx_i+b) \geq 1$

$s . t .$ 即subject to，受限制于······

稍微变化一下，约束条件就是 $min_{w,b}\ \frac 12||w||^2$ （平方是为了消掉根号）。

以上是支持向量机的基本型。

对偶问题(dual problem)

目标函数为二次，约束条件是线性的的问题称为凸二次规划问题。可以用现成的QP(Quadratic Programming，二次规划)优化包求解。

这里使用另一种方法，即将原问题通过引入拉格朗日乘子，变换到更容易求解的等价的对偶问题。

**拉格朗日对偶性(Lagrange Duality)**基本思想：引入拉格朗日乘子 $\alpha$ ，将含有n个变量k个约束条件的约束优化问题转换为含有n+k个变量的无约束优化问题，即把条件极值转换为无条件极值。

所以，我们把上面的优化问题转换成其对偶问题。定义拉格朗日函数：

$L(w,b,\alpha)=\frac12||w||^2-\Sigma_{i=1}^n\alpha_i[y_i(w^Tx_i+b)-1]$

然后令 $\theta(w)=max_{a_i\geq 0}L(w,b,\alpha)$ ，原问题即为 $min_{w,b}\theta(w)$ 。

由之前的数学推导，可以将原问题转化为对偶问题 $max_{\alpha_i\geq0}min_{w,b}L(w,b,\alpha)=d^*$ ，这里 $d^*$ 是 $p^*$ 的近似解，二者满足 $d^*\leq p^*$ ，且在满足KKT条件时两者等价。

求解此对偶问题，可以划分为两步：

$min_{w、b}$ ；
求解 $\alpha$ （这一步使用SMO算法）；

第一步

分别对w、b求偏导：

$\frac{\partial L}{\partial w}=0\Rightarrow w=\Sigma_{i=1}^n\alpha_iy_ix_i$

$\frac{\partial L}{\partial b}=0\Rightarrow \Sigma_{i=1}^n\alpha_iy_i=0$

将对w求偏导的式子带回函数 $L(w,b,\alpha)$ 中：

由此消去了 $w, b$ （只是消去，并没有求出），将拉格朗日方程转换为只包含一个变量即 $\alpha$ 的形式。将对偶问题转换为：

$max_{\alpha}\Sigma_{i=1}^n\alpha_i-\frac12\Sigma_{i,j=1}^n\alpha_i\alpha_jy_iy_jx_i^Tx_j\\s.t.,\alpha_i\geq0,i=1,...,n \\\ \ \ \ \ \ \ \ \ \Sigma_{i=1}^n\alpha_iy_i=0$

第二步：SMO算法(Sequential Minimal Optimization，序列最小优化算法)

基本思路：每次选出两个分量 $\alpha_i,\alpha_j$ 进行调整，其他分量保持不变，在得到解后，再用其改变其他分量。

注意到当 $\alpha$ 不满足KTT条件时，目标函数会在迭代后减小（前面提到了对偶问题的解更小）。于是SMO采用了一个启发式：先选取一个违背KTT条件最大的变量，再选取另一个阈值间隔最大的变量，然后再更新变量。

在只考虑 $\alpha_i$ 和 $\alpha_j$ 时，将第一步推导出的约束条件重写成

$\alpha_iy_i+\alpha_jy_j=c,\alpha_{i,j}\geq0$

其中， $c=-\Sigma_{k\neq i,j}\alpha_ky_k$ 。

也就是将 $\Sigma_{i=1}^n\alpha_iy_i=0$ 中的两项提出来，其余看成常数

于是可以消去约束问题中的 $\alpha_j$ （用 $\alpha_i$ 的式子带入），转换为单变量的二次规划问题，从而求出 $\alpha_i$ 。

详情见数学方法部分。

软间隔与松弛变量

在线性不可分的一些问题里，有时候将数据映射到高维空间后，仍然不好处理，或是数据本身有噪点。这时为了避免过拟合，我们引入松弛变量，允许SVM在一些样本上出错，将约束条件变为：

$y_i(w^Tx_i+b)\geq 1-\xi_i\\\xi_i\geq0,i=1,2,...,m$

其中 $\xi_i\geq 0$ 称为松弛变量，当然此时目标函数也要相应改变：

$min_{w,b,\xi_i}\frac12||w||^2+C\Sigma_{i=1}^m\xi_i$

后续步骤与之前做硬间隔处理时类似。

此时 $0\leq\alpha_i\leq C$ ，不同样本点且对应的位置为：

$α_i=0⇒y_if(x_i)≥1$

$0<α_i0<αi<C⇒yif(xi)=1$

$α_i=C⇒y_if(x_i)≤1$

核函数

上述讨论均建立在训练样本线性可分的条件上。当问题不是线性可分的的时候，通过引入核函数 $\kappa(·,·)$ 可以将样本空间映射到一个更高维的特征空间，并使样本在该空间内线性可分。

在线性不可分的情况下，SVM首先在低位空间中完成计算，然后通过核函数将输入空间映射到高维特征空间，最终在高维特征空间中构造出最优分离超平面。

例如，对于上面二维的线性不可分问题，一个明显的分界应该是一个圆圈，二不能用直线（二维中的超平面）划分，用于分界的圆圈在二维空间中可以表示为：

$a_1X_1+a_2X_2+a_3X_1X_2+a_4X_1^2+a_5X_2^2+a_6=0$

通过 $Z_1=X_1X_2,Z_2=X_1^2,Z_3=X_2^2,Z_4=X_1,Z_5=X_2$ 变换，将二维投射到五维空间，就可以将问题转换为线性问题。

相当于把问题：

中的 $x_i->\phi(x_i), x_j->\phi(x_j)$ ，将目标函数重写成：

$max_\alpha \alpha_i-\frac12\Sigma_{i,j=1}^n\alpha_i\alpha_jy_iy_j\kappa(x_i,x_j)$

这个方法虽然简便，但是低维到高维的数目是爆炸增长的。二维映射到五维，三维映射到十九维，等等，这在计算时是难以接受的。

我们比较上面提到的二维问题中映射后的内积 $<\phi(x_1),\phi(x_2)>$ 和 $(+1)^2$ 可以发现，展开后的结果是极为相似的，只需加上常数项，并将某几个维度线性放缩，就可以相互转换。

这种将两个向量隐式映射到高维空间中的函数叫核函数。用这种方法就可以将分类函数和对偶问题中的内积隐式映射到高维，而避免在高维中的计算。

我们引入核函数通常是希望将样本空间映射到线性可分的特征空间中，然而在不知道特征映射的形式时，我们不知道什么样的核函数是合适的。于是核函数的选择是SVM中的最大变数，很大程度上决定了SVM的性能。

列举几个常用的核函数。

名称	表达式	参数
线性核	$\kappa(x_i,x_j)=x_i^Tx_j$
多项式核	$\kappa(x_i,x_j)=(x^T_ix_j)^d$	$d\geq1$ 为多项式的次数
高斯核	$\kappa(x_i,x_j)=$ $\frac{\\|x_i-x_j\\|^2}{\sigma^2})$	$\sigma>0$ 为高斯核的带宽
拉普拉斯核	$\kappa(x_i,x_j)=$ $exp(-\frac{\\|x_i-x_j\\|}{\sigma})$	$\sigma>0$
Sigmoid核	$\kappa(x_i,x_j)=tanh(\beta x_i^Tx_j+\theta)$	$\beta>0,\theta<0$

如图所示（代码在文末）：

数学方法

拉格朗日对偶转化

转换对偶问题一般有两步：

将有约束的目标函数转换为无约束的拉格朗日函数
使用拉格朗日对称性，将不易求解的问题转换为易求解的问题

第一步：

由于我们要求解的是最小化问题，有一种方法是构造一个函数，使该函数在可行区域内与原目标函数完全一致，而在可行解区域外的数值无穷大。

拉格朗日乘数法

对于目标函数 $f (x)$ 和约束条件 $g_i(x)\leq0,\ i=1,2,...,m$ 和 $h_j(x)=0,\ j=1,2,...,k$ ，构成约束问题：

$min\ f(x)\ s.t.\ g_i(x)\leq0;h_j(x)=0,\ i=1,2,...,m,\ j=1,2,...,k$

引入拉格朗日乘子 $\alpha$ ，构造拉格朗日函数：

$L(x,\alpha,\beta)=f(x)+\Sigma_{i=1}^m\alpha_ig_i(x)+\Sigma_{j=1}^k\beta_jh_j(x),\ i=1,2,...,m,\ j=1,2,...,k$

导出方程组：

$\begin{cases}\frac{\partial L}{\partial x_i}=\frac{\partial f}{\partial x_i}+\alpha_i\frac{\partial g_i}{\partial x_i}=0&\text{,i=1,2,...,m}\\\frac{\partial L}{\partial x_j}=\frac{\partial f}{\partial x_j}+\beta_j\frac{\partial h_j}{\partial x_j}=0&\text{j=1,2,...,k}\\\frac{\partial L}{\partial \alpha_i}=g_i=0&\text{,i=1,2,...,m}\\\frac{\partial L}{\partial \alpha_j}=h_j=0&\text{,j=1,2,...,k}\end{cases}$

对应的解 $\overline x=(\overline x_1,\overline x_2,...,\overline x_n)$ 即为目标函数在约束条件下的极小值点。

然而，拉格朗日数乘法使用求导的方法求解依然困难，这里使用一个数学技巧，即

拉格朗日对偶

构造关于 $x$ 的函数：

$\theta_p(x)=max_{\alpha,\beta;\alpha_i\geq0}L(x,\alpha,\beta)$

在 $g (x) > 0$ 或 $h(x)\neq0$ 时，令 $\alpha\rightarrow\infty$ 或 $\beta\rightarrow\infty$ ;否则 $\alpha=0,\beta=0$ ，于是有

$\theta_p(x)=\begin{cases}f(x)&\text{,x满足约束条件}\\+\infty&\text{,其它}\end{cases}$

至此我们将极小化问题转换为

$min_xmax_{\alpha,\beta;\alpha_i\geq0}L(x,\alpha,\beta)$

定义原问题的最优值 $p^*=min_x\ \theta_p(\alpha,\beta)$

第二步：

转换为拉格朗日对偶问题

上述极小极大问题的对偶问题为极大极小问题：

$max_{\alpha,\beta;\alpha_i\geq0}min_xL(x,\alpha,\beta)$

则对偶问题的最优值 $d^*=max_{\alpha,\beta;\alpha_i\geq0}\ \theta_p(\alpha,\beta)$

原始问题与对偶问题的关系

为什么要对偶处理？

对于原问题，

只要原问题和对偶问题都有最优解，即满足弱对偶性： $d^*\geq p^*$

而如果我们找到取等的条件（即满足强对偶性： $d^*=p^*$ ），使二者的最优解相等，就可以通过求解对偶问题来求解原问题。使强对偶性成立的条件有很多，比如Slater条件和KKT条件。这里不加证明地使用KKT条件。

KKT(Karush-Kuhn-Tucker)条件

$\nabla_xL(x^*,\alpha^*,\beta^*)=0$

$g_i(x)\leq0$

$h_j(x)=0$

$\alpha_i\geq0$

$\alpha_ig_i(x)=0$

SMO算法(Sequential Minimal Optimization)

坐标上升法(Coordinate Ascent)

SMO算法的思想与坐标上升算法的思想类似，所以在此通过坐标上升法来引入SMO算法。

坐标上升法，即每次通过更新多元函数中的一维，多次迭代直到收敛来达到优化函数的目的。

例如，对于优化问题 $max_\alpha W(\alpha_1,\alpha2,...,\alpha_n)$ ，我们每次选取一个 $\alpha_i$ ，通过更新 $\alpha_i$ 使其向极大值靠近，多次重复，直到函数达到局部最优。

因为每次只是做一维优化，所以每个循环中的优化过程的效率是很高的, 但是迭代的次数会比较多。

SMO算法介绍

先给出SVM问题的对偶形式：

$max_{\alpha}\Sigma_{i=1}^n\alpha_i-\frac12\Sigma_{i,j=1}^n\alpha_i\alpha_jy_iy_jx_i^Tx_j\\s.t.,\alpha_i\geq0,i=1,...,n \\\ \ \ \ \ \ \ \ \ \Sigma_{i=1}^n\alpha_iy_i=0$

不妨将目标函数写成：

$min\frac12\Sigma_{i=1,j=1}^ny_iy_j\alpha_i\alpha_jK_{ij}-\Sigma_{i=1}^n\alpha_i$

其中 $K_{ij}=(x_i·x_j)$

在这个问题中，我们需要对 $max_\alpha L(\alpha_1,\alpha2,...,\alpha_n)$ 进行优化。所以SMO算法每次选取一对变量 $(\alpha_i,\alpha_j),(i\neq j)$ ，不妨令 $i = 1, j = 2$ 。

注意这里不能像坐标上升法那样只选取一个 $\alpha$ 进行更新，因为这里的 $\alpha$ 具有约束 $\Sigma_{i=1}^n\alpha_iy_i=0$ ，使得当更新一个 $\alpha_i$ 时，必然需要更新另一个 $\alpha_j$ 使得约束条件成立。

硬间隔下的最优

记 $v_i=\Sigma_{j=3}^ny_j\alpha_jK_{ij}$ 逐步化简目标函数：，将含有 $\alpha_1、\alpha_2$ 的式子提出

$min\frac12\Sigma_{i=1,j=1}^ny_iy_j\alpha_i\alpha_jK_{ij}-\Sigma_{i=1}^n\alpha_i\\=min\frac12\Sigma_{i,j=3}^ny_iy_j\alpha_i\alpha_jK_{ij}-\Sigma_{i=3}^n\alpha_i-(\alpha_1+\alpha_2)+\frac12(\alpha_1^2K_{11}+\alpha_2^2K_{22}+2\alpha_1\alpha_2y_1y_2K_{12}+2\alpha_1y_1v_1+2\alpha_2y_2v_2)$

且 $\alpha_1、\alpha_2$ 有关系：

$\alpha_1y_1+\alpha_2y_2=-\Sigma_{i\neq1,2}^n \alpha_iy_i= C$

两边同时乘以 $y_1$ ，得

$\alpha_1=Cy_1-\alpha_2y_2y_1\\\alpha_1^2=(k-\alpha_2y_2)^2=C^2-2C\alpha_2y_2+\alpha_2^2\\2y_1y_2\alpha_1\alpha_2K_{12}=2(Cy_2-\alpha_2)\alpha_2K_{12}\\2y_1\alpha_1v_1=2(\xi_i-\alpha_2y_2)v_1$

带入到目标函数中，化简得

$min_{\alpha_2}\frac12(K_{11}+K_{22}-2K_{12})\alpha_2^2+(y_1y_2-1-Cy_2K_{11}+Cy_2K_{12}-y_2v_1+y_2v_2)\alpha_2+\frac12C^2K_{11}+Cv_1-Cy_1$

记为 $min_{\alpha_2}W(\alpha_2)$ ，凸函数在 $\frac{\partial W}{\partial\alpha_2}=0$ 处取极值

$\frac{\partial W}{\partial\alpha_2}=(K_{11}+K_{22}-2K_{12})\alpha_2+(y_1y_2-1-Cy_2K_{11}+Cy_2K_{12}-y_2v_1+y_2v_2)=0$

故可以解出 $\alpha_2$ 我们将一开始取定的 $\alpha_1\alpha_2$ 记为 $\alpha_1^{old}\alpha_2^{old}$ ，解出的 $\alpha_1\alpha_2$ 记为 $\alpha_1^{new}\alpha_2^{new}$ 。

$K_{11}+K_{22}-2K_{12}=(x_1+x_2)^2$ ，记为 $\kappa$ 。

同时记 $f(x_i)=\Sigma_{j=1}^ny_j\alpha_jK_{ij}$ （即超平面方程），则 $v_1、v_2$ 用 $g(x_1)、g(x_2)$ 表示为

$v_1=g(x_1)+y_2\alpha_2(K_{11}-K_{12}-CK_{11})$

$v_2=g(x_2)+y_2\alpha_2(K_{21}-K_{22}-CK_{21})$

$v_1-v_2=f(x_1)-f(x_2)+y_2\kappa\alpha_2-C(K_{11}-K_{12})$

可以解出

$y_2\kappa\alpha_2^{new}=-y_1+y_2+CK_{11}-CK_{12}+v_1-v_2\\\ \ \ \ \ \ \ \ \ \ \ \ \ \ =(f(x_1)-y_1)-(f(x_2-y_2))+y_2\kappa\alpha_2^{old}$

于是 $\alpha_2^{new}=\alpha_2^{old}+\frac{y_2(E_1-E_2)}{\kappa}$

换成一般的下标，即为 $\alpha_j^{new}=\alpha_j^{old}+\frac{y_j(E_i-E_j)}{\kappa}$

我们先不着急算出 $\alpha_i$ ，在实际应用中我们常常要允许SVM”出错“，这时需要引入软间隔，此时约束条件也会相应改变。

软间隔下的最优

先分析一下软间隔时约束条件

$0\leq\alpha_i\leq C,i=1,...,n\\\alpha_1y_1+\alpha_2y_2=\xi$

当取定 $\alpha_1\alpha_2$ 时，四种情况下约束条件可以看做四条围成方形的直线

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0mgObYns-1589534426589)(https://pic3.zhimg.com/80/v2-449670775bab3c385b5e5930fc6d2caa_720w.png)]

此图中纵轴为 $\alpha_2$ ，横轴为 $\alpha_1$ ， $k=\pm\xi$

左图解析式： $\alpha_2=\alpha_1-k$

右图解析式： $\alpha_2=-\alpha_1+k$

先分别求出上下界，从而确定 $\alpha^{new}$ 的更新。

左图：

红线： $m a x = C, m i n = - k$ ，黑线： $m a x = C - k, m i n = 0$ 。

上界： $H=min(C,C-k)=min(C,C-\alpha_1^{old}+\alpha_2^{old})$

下界： $L=max(0,-k)=max(0,\alpha_2^{old}-\alpha_1^{old})$

右图：

红线： $m a x = C, m i n = - C + k$ ，黑线： $m a x = k, m i n = 0$

上界： $H=min(C,k)=min(C,\alpha_1^{old}+\alpha_2^{old})$

下界： $L=max(0,-C+k)=min(0,-C+\alpha_1^{old}+\alpha_2^{old})$

求出上下界后，我们可以得到软间隔下的 $\alpha_2^{new}$

$\alpha_2^{new}=\begin{cases}H&\alpha_2^{new}>H\\\alpha_2^{new}&L\leq\alpha_2^{new}\leq H\\L&\alpha_2^{new}α2new=⎩⎪⎨⎪⎧Hα2newLα2new>HL≤α2new≤Hα2new<L$

其中右式中的 $\alpha_2^{new}$ 为硬间隔下的更新值，左式为软间隔下的更新值。

求出 $\alpha_2^{new}$ 后，根据 $\alpha_1^{old}+\alpha_2^{old}=\alpha_1^{new}+\alpha_2^{new}$ ，即可求出 $\alpha_1^{new}$ 。

更新 $b$

在对偶问题中，我们并没有用到 $b$ ，那为什么还需要更新 $b$ 呢？

$max_{\alpha}\Sigma_{i=1}^n\alpha_i-\frac12\Sigma_{i,j=1}^n\alpha_i\alpha_jy_iy_jx_i^Tx_j\\s.t.,\alpha_i\geq0,i=1,...,n \\\ \ \ \ \ \ \ \ \ \Sigma_{i=1}^n\alpha_iy_i=0$

我们发现，在 $\alpha$ 的更新过程中 $\alpha_j^{new}=\alpha_j^{old}+\frac{y_j(E_i-E_j)}{\kappa}$ ， $E$ 的计算时用到了 $b$ ，所以 $b$ 的值也会影响到 $\alpha$ 的更新，故我们需要更新 $b$ 。

我们选取了两个支持向量，均满足 $y_i(w^Tx+b)=1\Rightarrow \Sigma_{j=1}^n\alpha_jy_jK_{ji}+b=y_i$ 。

可以更新 $b$ ：

$b_1^{new}=-E1+(\alpha_1^{old}-\alpha_1^{new})y_1K_{11}+(\alpha_2^{old}-\alpha_2^{new})y_2K_{21}+b^{old}$

$b_2^{new}=-E2+(\alpha_1^{old}-\alpha_1^{new})y_1K_{12}+(\alpha_2^{old}-\alpha_2^{new})y_2K_{22}+b^{old}$

最终选择二者均值作为新的 $b$

$b^{new}=\frac{b_1^{new}+b_2^{new}}{2}$

SVM实现

简单线性SVM

代码来自Jack-Cherish/Machine-Learning

先上最后结果

可视化训练集

# -*- coding:UTF-8 -*-
import matplotlib.pyplot as plt
import numpy as np

"""
函数说明:读取数据

Parameters:
    fileName - 文件名
Returns:
    dataMat - 数据矩阵
    labelMat - 数据标签
Author:
    Jack Cui
Blog:
    http://blog.csdn.net/c406495762
Zhihu:
    https://www.zhihu.com/people/Jack--Cui/
Modify:
    2017-09-21
"""
def loadDataSet(fileName):
    dataMat = []; labelMat = []
    fr = open(fileName)
    for line in fr.readlines():                                     #逐行读取，滤除空格等
        lineArr = line.strip().split('\t')
        dataMat.append([float(lineArr[0]), float(lineArr[1])])      #添加数据
        labelMat.append(float(lineArr[2]))                          #添加标签
    return dataMat,labelMat

"""
函数说明:数据可视化

Parameters:
    dataMat - 数据矩阵
    labelMat - 数据标签
Returns:
    无
Author:
    Jack Cui
Blog:
    http://blog.csdn.net/c406495762
Zhihu:
    https://www.zhihu.com/people/Jack--Cui/
Modify:
    2017-09-21
"""
def showDataSet(dataMat, labelMat):
    data_plus = []                                  #正样本
    data_minus = []                                 #负样本
    for i in range(len(dataMat)):
        if labelMat[i] > 0:
            data_plus.append(dataMat[i])
        else:
            data_minus.append(dataMat[i])
    data_plus_np = np.array(data_plus)              #转换为numpy矩阵
    data_minus_np = np.array(data_minus)            #转换为numpy矩阵
    plt.scatter(np.transpose(data_plus_np)[0], np.transpose(data_plus_np)[1])   #正样本散点图
    plt.scatter(np.transpose(data_minus_np)[0], np.transpose(data_minus_np)[1]) #负样本散点图
    plt.show()

if __name__ == '__main__':
    dataMat, labelMat = loadDataSet(r'D:\VS-Code-python\ML_algorithm\support_vector_machine\train_data.txt')
    showDataSet(dataMat, labelMat)

SMO算法

# -*- coding:UTF-8 -*-
from time import sleep
import matplotlib.pyplot as plt
import numpy as np
import random
import types

"""
函数说明:读取数据

Parameters:
    fileName - 文件名
Returns:
    dataMat - 数据矩阵
    labelMat - 数据标签
Author:
    Jack Cui
Blog:
    http://blog.csdn.net/c406495762
Zhihu:
    https://www.zhihu.com/people/Jack--Cui/
Modify:
    2017-09-21
"""
def loadDataSet(fileName):
    dataMat = []; labelMat = []
    fr = open(fileName)
    for line in fr.readlines():                                     #逐行读取，滤除空格等
        lineArr = line.strip().split('\t')
        dataMat.append([float(lineArr[0]), float(lineArr[1])])      #添加数据
        labelMat.append(float(lineArr[2]))                          #添加标签
    return dataMat,labelMat


"""
函数说明:随机选择alpha

Parameters:
    i - alpha
    m - alpha参数个数
Returns:
    j -
Author:
    Jack Cui
Blog:
    http://blog.csdn.net/c406495762
Zhihu:
    https://www.zhihu.com/people/Jack--Cui/
Modify:
    2017-09-21
"""
def selectJrand(i, m):
    j = i                                 #选择一个不等于i的j
    while (j == i):
        j = int(random.uniform(0, m))
    return j

"""
函数说明:修剪alpha

Parameters:
    aj - alpha值
    H - alpha上限
    L - alpha下限
Returns:
    aj - alpah值
Author:
    Jack Cui
Blog:
    http://blog.csdn.net/c406495762
Zhihu:
    https://www.zhihu.com/people/Jack--Cui/
Modify:
    2017-09-21
"""
def clipAlpha(aj,H,L):
    if aj > H:
        aj = H
    if L > aj:
        aj = L
    return aj

"""
函数说明:简化版SMO算法

Parameters:
    dataMatIn - 数据矩阵
    classLabels - 数据标签
    C - 松弛变量
    toler - 容错率
    maxIter - 最大迭代次数
Returns:
    无
Author:
    Jack Cui
Blog:
    http://blog.csdn.net/c406495762
Zhihu:
    https://www.zhihu.com/people/Jack--Cui/
Modify:
    2017-09-23
"""
def smoSimple(dataMatIn, classLabels, C, toler, maxIter):
    #转换为numpy的mat存储
    dataMatrix = np.mat(dataMatIn); labelMat = np.mat(classLabels).transpose()
    #初始化b参数，统计dataMatrix的维度
    b = 0; m,n = np.shape(dataMatrix)
    #初始化alpha参数，设为0
    alphas = np.mat(np.zeros((m,1)))
    #初始化迭代次数
    iter_num = 0
    #最多迭代matIter次
    while (iter_num < maxIter):
        alphaPairsChanged = 0
        for i in range(m):
            #步骤1：计算误差Ei
            fXi = float(np.multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[i,:].T)) + b
            Ei = fXi - float(labelMat[i])
            #优化alpha，更设定一定的容错率。
            if ((labelMat[i]*Ei < -toler) and (alphas[i] < C)) or ((labelMat[i]*Ei > toler) and (alphas[i] > 0)):
                #随机选择另一个与alpha_i成对优化的alpha_j
                j = selectJrand(i,m)
                #步骤1：计算误差Ej
                fXj = float(np.multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[j,:].T)) + b
                Ej = fXj - float(labelMat[j])
                #保存更新前的aplpha值，使用深拷贝
                alphaIold = alphas[i].copy(); alphaJold = alphas[j].copy();
                #步骤2：计算上下界L和H
                if (labelMat[i] != labelMat[j]):
                    L = max(0, alphas[j] - alphas[i])
                    H = min(C, C + alphas[j] - alphas[i])
                else:
                    L = max(0, alphas[j] + alphas[i] - C)
                    H = min(C, alphas[j] + alphas[i])
                if L==H: print("L==H"); continue
                #步骤3：计算eta
                eta = 2.0 * dataMatrix[i,:]*dataMatrix[j,:].T - dataMatrix[i,:]*dataMatrix[i,:].T - dataMatrix[j,:]*dataMatrix[j,:].T
                if eta >= 0: print("eta>=0"); continue
                #步骤4：更新alpha_j
                alphas[j] -= labelMat[j]*(Ei - Ej)/eta
                #步骤5：修剪alpha_j
                alphas[j] = clipAlpha(alphas[j],H,L)
                if (abs(alphas[j] - alphaJold) < 0.00001): print("alpha_j变化太小"); continue
                #步骤6：更新alpha_i
                alphas[i] += labelMat[j]*labelMat[i]*(alphaJold - alphas[j])
                #步骤7：更新b_1和b_2
                b1 = b - Ei- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[i,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[i,:]*dataMatrix[j,:].T
                b2 = b - Ej- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[j,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[j,:]*dataMatrix[j,:].T
                #步骤8：根据b_1和b_2更新b
                if (0 < alphas[i]) and (C > alphas[i]): b = b1
                elif (0 < alphas[j]) and (C > alphas[j]): b = b2
                else: b = (b1 + b2)/2.0
                #统计优化次数
                alphaPairsChanged += 1
                #打印统计信息
                print("第%d次迭代 样本:%d, alpha优化次数:%d" % (iter_num,i,alphaPairsChanged))
        #更新迭代次数
        if (alphaPairsChanged == 0): iter_num += 1
        else: iter_num = 0
        print("迭代次数: %d" % iter_num)
    return b,alphas

"""
函数说明:分类结果可视化

Parameters:
    dataMat - 数据矩阵
    w - 直线法向量
    b - 直线解决
Returns:
    无
Author:
    Jack Cui
Blog:
    http://blog.csdn.net/c406495762
Zhihu:
    https://www.zhihu.com/people/Jack--Cui/
Modify:
    2017-09-23
"""
def showClassifer(dataMat, w, b):
    #绘制样本点
    data_plus = []                                  #正样本
    data_minus = []                                 #负样本
    for i in range(len(dataMat)):
        if labelMat[i] > 0:
            data_plus.append(dataMat[i])
        else:
            data_minus.append(dataMat[i])
    data_plus_np = np.array(data_plus)              #转换为numpy矩阵
    data_minus_np = np.array(data_minus)            #转换为numpy矩阵
    plt.scatter(np.transpose(data_plus_np)[0], np.transpose(data_plus_np)[1], s=30, alpha=0.7)   #正样本散点图
    plt.scatter(np.transpose(data_minus_np)[0], np.transpose(data_minus_np)[1], s=30, alpha=0.7) #负样本散点图
    #绘制直线
    x1 = max(dataMat)[0]
    x2 = min(dataMat)[0]
    a1, a2 = w
    b = float(b)
    a1 = float(a1[0])
    a2 = float(a2[0])
    y1, y2 = (-b- a1*x1)/a2, (-b - a1*x2)/a2
    plt.plot([x1, x2], [y1, y2])
    #找出支持向量点
    for i, alpha in enumerate(alphas):
        if abs(alpha) > 0:
            x, y = dataMat[i]
            plt.scatter([x], [y], s=150, c='none', alpha=0.7, linewidth=1.5, edgecolor='red')
    plt.show()


"""
函数说明:计算w

Parameters:
    dataMat - 数据矩阵
    labelMat - 数据标签
    alphas - alphas值
Returns:
    无
Author:
    Jack Cui
Blog:
    http://blog.csdn.net/c406495762
Zhihu:
    https://www.zhihu.com/people/Jack--Cui/
Modify:
    2017-09-23
"""
def get_w(dataMat, labelMat, alphas):
    alphas, dataMat, labelMat = np.array(alphas), np.array(dataMat), np.array(labelMat)
    w = np.dot((np.tile(labelMat.reshape(1, -1).T, (1, 2)) * dataMat).T, alphas)
    return w.tolist()


if __name__ == '__main__':
    dataMat, labelMat = loadDataSet(r'D:\VS-Code-python\ML_algorithm\support_vector_machine\train_data.txt')
    b,alphas = smoSimple(dataMat, labelMat, 0.6, 0.001, 40)
    w = get_w(dataMat, labelMat, alphas)
    showClassifer(dataMat, w, b)

附数据集

3.542485	1.977398	-1
3.018896	2.556416	-1
7.551510	-1.580030	1
2.114999	-0.004466	-1
8.127113	1.274372	1
7.108772	-0.986906	1
8.610639	2.046708	1
2.326297	0.265213	-1
3.634009	1.730537	-1
0.341367	-0.894998	-1
3.125951	0.293251	-1
2.123252	-0.783563	-1
0.887835	-2.797792	-1
7.139979	-2.329896	1
1.696414	-1.212496	-1
8.117032	0.623493	1
8.497162	-0.266649	1
4.658191	3.507396	-1
8.197181	1.545132	1
1.208047	0.213100	-1
1.928486	-0.321870	-1
2.175808	-0.014527	-1
7.886608	0.461755	1
3.223038	-0.552392	-1
3.628502	2.190585	-1
7.407860	-0.121961	1
7.286357	0.251077	1
2.301095	-0.533988	-1
-0.232542	-0.547690	-1
3.457096	-0.082216	-1
3.023938	-0.057392	-1
8.015003	0.885325	1
8.991748	0.923154	1
7.916831	-1.781735	1
7.616862	-0.217958	1
2.450939	0.744967	-1
7.270337	-2.507834	1
1.749721	-0.961902	-1
1.803111	-0.176349	-1
8.804461	3.044301	1
1.231257	-0.568573	-1
2.074915	1.410550	-1
-0.743036	-1.736103	-1
3.536555	3.964960	-1
8.410143	0.025606	1
7.382988	-0.478764	1
6.960661	-0.245353	1
8.234460	0.701868	1
8.168618	-0.903835	1
1.534187	-0.622492	-1
9.229518	2.066088	1
7.886242	0.191813	1
2.893743	-1.643468	-1
1.870457	-1.040420	-1
5.286862	-2.358286	1
6.080573	0.418886	1
2.544314	1.714165	-1
6.016004	-3.753712	1
0.926310	-0.564359	-1
0.870296	-0.109952	-1
2.369345	1.375695	-1
1.363782	-0.254082	-1
7.279460	-0.189572	1
1.896005	0.515080	-1
8.102154	-0.603875	1
2.529893	0.662657	-1
1.963874	-0.365233	-1
8.132048	0.785914	1
8.245938	0.372366	1
6.543888	0.433164	1
-0.236713	-5.766721	-1
8.112593	0.295839	1
9.803425	1.495167	1
1.497407	-0.552916	-1
1.336267	-1.632889	-1
9.205805	-0.586480	1
1.966279	-1.840439	-1
8.398012	1.584918	1
7.239953	-1.764292	1
7.556201	0.241185	1
9.015509	0.345019	1
8.266085	-0.230977	1
8.545620	2.788799	1
9.295969	1.346332	1
2.404234	0.570278	-1
2.037772	0.021919	-1
1.727631	-0.453143	-1
1.979395	-0.050773	-1
8.092288	-1.372433	1
1.667645	0.239204	-1
9.854303	1.365116	1
7.921057	-1.327587	1
8.500757	1.492372	1
1.339746	-0.291183	-1
3.107511	0.758367	-1
2.609525	0.902979	-1
3.263585	1.367898	-1
2.912122	-0.202359	-1
1.731786	0.589096	-1
2.387003	1.573131	-1

sklearn实现线性SVM

# -*- coding:utf-8 -*-

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import classification_report, confusion_matrix

if __name__ == '__main__':
    #load data
    filename = r'D:\VS-Code-python\ML_algorithm\support_vector_machine\bill_authentication.csv'
    bankdata = pd.read_csv(filename)
    #print(bankdata.head)
    #properties
    # Variance:图像的方差
    # Skewness:偏度
    # Kurtosis:峰度
    # Entropy:熵
    # Class:类别
    
    #pretreatment
    X = bankdata.drop('Class', axis=1)
    y = bankdata['Class']
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.20)

    #training
    svclassifier = SVC(kernel='linear')
    svclassifier.fit(X_train, y_train)

    #prediction
    y_pred = svclassifier.predict(X_test)

    #assessment
    print(confusion_matrix(y_test, y_pred))
    print(classification_report(y_test, y_pred))

out:

[[151   1]
 [  0 123]]
              precision    recall  f1-score   support

           0       1.00      0.99      1.00       152
           1       0.99      1.00      1.00       123

   micro avg       1.00      1.00      1.00       275
   macro avg       1.00      1.00      1.00       275
weighted avg       1.00      1.00      1.00       275

可视化比较线性核与高斯核

# -*- coding:utf-8 -*-

import numpy as np
import pandas as pd
from sklearn import svm
from sklearn.metrics import accuracy_score
import matplotlib as mpl
import matplotlib.colors
import matplotlib.pyplot as plt


if __name__ == "__main__":
    data = pd.read_csv(r'D:\VS-Code-python\ML_algorithm\support_vector_machine\test_data.txt', sep='\t', header=None)
    x, y = data[[0, 1]], data[2]

    # 分类器
    clf_param = (('linear', 0.1), ('linear', 0.5), ('linear', 1), ('linear', 2),
                ('rbf', 1, 0.1), ('rbf', 1, 1), ('rbf', 1, 10), ('rbf', 1, 100),
                ('rbf', 5, 0.1), ('rbf', 5, 1), ('rbf', 5, 10), ('rbf', 5, 100))
    x1_min, x2_min = np.min(x, axis=0)
    x1_max, x2_max = np.max(x, axis=0)
    x1, x2 = np.mgrid[x1_min:x1_max:200j, x2_min:x2_max:200j]
    grid_test = np.stack((x1.flat, x2.flat), axis=1)

    cm_light = mpl.colors.ListedColormap(['#77E0A0', '#FFA0A0'])
    cm_dark = mpl.colors.ListedColormap(['g', 'r'])
    mpl.rcParams['font.sans-serif'] = ['SimHei']
    mpl.rcParams['axes.unicode_minus'] = False
    plt.figure(figsize=(13, 9), facecolor='w')
    for i, param in enumerate(clf_param):
        clf = svm.SVC(C=param[1], kernel=param[0])
        if param[0] == 'rbf':
            clf.gamma = param[2]
            title = '高斯核，C=%.1f，$\gamma$ =%.1f' % (param[1], param[2])
        else:
            title = '线性核，C=%.1f' % param[1]

        clf.fit(x, y)
        y_hat = clf.predict(x)
        print('准确率：', accuracy_score(y, y_hat))

        # 画图
        print(title)
        print('支持向量的数目：', clf.n_support_)
        print('支持向量的系数：', clf.dual_coef_)
        print('支持向量：', clf.support_)
        plt.subplot(3, 4, i+1)
        grid_hat = clf.predict(grid_test)       # 预测分类值
        grid_hat = grid_hat.reshape(x1.shape)  # 使之与输入的形状相同
        plt.pcolormesh(x1, x2, grid_hat, cmap=cm_light, alpha=0.8)
        plt.scatter(x[0], x[1], c=y, edgecolors='k', s=40, cmap=cm_dark)      # 样本的显示
        plt.scatter(x.loc[clf.support_, 0], x.loc[clf.support_, 1], edgecolors='k', facecolors='none', s=100, marker='o')   # 支持向量
        z = clf.decision_function(grid_test)
        # print 'z = \n', z
        print('clf.decision_function(x) = ', clf.decision_function(x))
        print('clf.predict(x) = ', clf.predict(x))
        z = z.reshape(x1.shape)
        plt.contour(x1, x2, z, colors=list('kbrbk'), linestyles=['--', '--', '-', '--', '--'],
                    linewidths=[1, 0.5, 1.5, 0.5, 1], levels=[-1, -0.5, 0, 0.5, 1])
        plt.xlim(x1_min, x1_max)
        plt.ylim(x2_min, x2_max)
        plt.title(title, fontsize=12)
    plt.suptitle('SVM不同参数的分类', fontsize=16)
    plt.tight_layout(1.4)
    plt.subplots_adjust(top=0.92)
    plt.show()

参考资料：

支持向量机通俗导论（理解SVM的三层境界）

《机器学习》——周志华

支持向量机（SVM）——原理篇

拉格朗日对偶性

Python3《机器学习实战》学习笔记（八）：支持向量机原理篇之手撕线性SVM

机器学习算法实践-SVM中的SMO算法

你可能感兴趣的:(Machine,learning,机器学习,算法,支持向量机)

你懂安全优化SSL嘛? 巴依老爷coder 安全安全 ssl 网络协议
一文带你了解SSL全部内容CIA?SSL概述加密算法对比数字签名与证书RSA加密算法代码实操1.更完善的错误处理2.证书验证3.资源管理改进常见的面试问题CIA?在信息安全领域，CIA（保密性、完整性、可用性）是核心原则，各有其实现方法与面临的威胁：保密性：实现方法：运用加密技术，对称加密（如AES）适合大量数据快速加密，非对称加密（如RSA）用于密钥交换与数字签名；借助访问控制手段，像基于角色的
【Python 算法零基础 4.排序 ⑦ 桶排序】 L_cl Python常见算法排序算法数据结构算法
草木不争高，争的是生生不息——25.5.26选择排序回顾①遍历数组：从索引0到n-1（n为数组长度）。②每轮确定最小值：假设当前索引i为最小值索引min_index。从i+1到n-1遍历，若找到更小元素，则更新min_index。③交换元素：若min_index≠i，则交换arr[i]与arr[min_index]。'''①遍历数组：从索引 0 到 n-1（n 为数组长度）。②每轮确定最小值：假设
【Python 算法零基础 4.排序 ⑥ 快速排序】 L_cl Python常见算法排序算法算法
既有锦绣前程可奔赴，亦有往日岁月可回首——25.5.25选择排序回顾①遍历数组：从索引0到n-1（n为数组长度）。②每轮确定最小值：假设当前索引i为最小值索引min_index。从i+1到n-1遍历，若找到更小元素，则更新min_index。③交换元素：若min_index≠i，则交换arr[i]与arr[min_index]。'''①遍历数组：从索引 0 到 n-1（n 为数组长度）。②每轮确定
Apple A 系列芯片 Camera 架构解析：ISP + NPU 图像管线协同机制全景实战观熵影像技术全景图谱：架构调优与实战架构接口隔离原则影像 Camera
AppleA系列芯片Camera架构解析：ISP+NPU图像管线协同机制全景实战关键词：AppleA系列、图像信号处理器（ISP）、神经网络引擎（NPU）、SmartHDR、DeepFusion、图像协同计算、图像路径优化、拍照性能、图像延迟控制、AppleSilicon摘要：苹果在A系列芯片中持续深化ISP与NPU的协同架构，实现图像质量、算法速度与功耗的高度平衡。从A11到A17Pro，App
操作系统——磁盘调度算法代码实现十指流玉笔记操作系统
磁盘调度算法先来先服务算法（FCFS）：先来先服务算法根据访问磁盘的先后顺序进行，由当前磁头位置移动到首先到达缓存区的磁盘。优点：公平/简单，该算法的平均寻道时间相对较长。voidFCFS(){intsum=0;intstart;intFind[11];cout>start;cout>Find[i];}cout";for(inti=1;i";}cout>start;cout>Find[i].loc
【一起来学AI大模型】支持向量机（SVM）：核心算法深度解析运器123 AI大模型支持向量机机器学习人工智能 ai 大数据 AI编程算法
一、算法核心思想支持向量机（SVM）是一种强大的监督学习算法，核心思想是通过寻找最优超平面实现分类或回归：分类目标：找到能最大化两类数据间隔的超平面回归目标：找到包含最多数据点的ε带关键概念图解超平面：w·x+b=0/\/\+1|支持向量|-1|●●||●●||●●||_________________|最大间隔(margin)二、数学原理与优化问题1.线性可分情况目标函数：\min_{w,b}\
JVM垃圾回收机制深度解析真实的菜 jvm jvm
️JVM垃圾回收机制深度解析文章目录️JVM垃圾回收机制深度解析垃圾判定算法引用计数法可达性分析算法垃圾回收算法️标记-清除算法复制算法标记-整理算法️分代收集算法️常见垃圾收集器Serial收集器⚡ParNew收集器Parallel收集器CMS收集器G1收集器⚡垃圾回收调优常用JVM调优参数️调优工具使用：JConsole、VisualVMJConsoleVisualVM实战案例分析案例一：内存
【一起来学AI大模型】算法核心：数组/哈希表/树/排序/动态规划（LeetCode精练）运器123 AI大模型 python 开发语言人工智能 AI AI编程算法散列表
以下是五大核心算法的重点解析和LeetCode经典题解，包含最优解法和模板代码：一、数组操作（双指针/滑动窗口）核心思想：通过索引指针高效遍历与操作数组1.移动零（No.283）defmoveZeroes(nums):slow=0forfastinrange(len(nums)):ifnums[fast]!=0:nums[slow],nums[fast]=nums[fast],nums[slow]
探索Cachier：Python函数的持久化缓存利器胡同琥Randolph
探索Cachier：Python函数的持久化缓存利器cachierPersistent,stale-free,localandcross-machinecachingforPythonfunctions.项目地址:https://gitcode.com/gh_mirrors/ca/cachier在Python开发的世界中，性能优化和资源管理是永恒的话题。今天，我们要介绍的是一个强大的开源项目——C
Pixhawk源码笔记五：存储与EEPROM管理 zhouxinlin2009
这里，我们对APMEEPROM存储接口进行讲解。如有问题，可以交流[email protected]。新浪@WalkAnt，转载本博客文章，请注明出处，以便更大范围的交流，谢谢。第六部分存储与EEPROM管理详细参考：http://dev.ardupilot.com/wiki/learning-ardupilot-storage-and-eeprom-management/用户参数、航点、集结点、地图
暑假算法日记第三天
目标：刷完灵神专题训练算法题单阶段目标：【算法题单】滑动窗口与双指针LeetCode题目:3439.重新安排会议得到最多空余时间I2134.最少交换次数来组合所有的1II1297.子串的最大出现次数2653.滑动子数组的美丽值1888.使二进制字符串字符交替的最少反转次数567.字符串的排列438.找到字符串中所有字母异位词30.串联所有单词的子串2156.查找给定哈希值的子串其他:今日总结往期打
华为OD机试 2025B卷 - 货币单位转换(C++&Python&JAVA&JS&C语言) YOLO大师华为od c++python 华为OD机试华为OD机试2025B卷华为OD2025B卷华为OD机考2025B卷
2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型题目描述记账本上记录了若干条多国货币金额，需要转换成人民币分（fen），汇总后输出。每行记录一条金额，金额带有货币单位，格式为数字+单位，可能是单独元，或者单独分，或者元与分的组合。要求将这些货币全部换算成人民币分（fen）后进行汇总，汇总结果仅保留整数，小数部分舍弃。元和分的换算关系都是
基于迁移学习的多视图卷积神经网络在乳腺超声自动分类中的应用 despacito, 论文精读-乳腺超声分类
BREASTCANCERCLASSIFICATIONINAUTOMATEDBREASTULTRASOUNDUSINGMULTIVIEWCONVOLUTIONALNEURALNETWORKWITHTRANSFERLEARNINGYIWANG,*,1EUNJUNGCHOI,y,1YOUNHEECHOI,*HAOZHANG,*GONGYONGJIN,yandSEOK-BUMKO*TAGGEDEND*De
C++二分查找入门指南
一、二分法概述二分查找（BinarySearch）是一种在‌有序数组‌中查找特定元素的高效算法。它的基本思想是通过不断将搜索范围减半来快速定位目标元素，时间复杂度为O(logn)，远优于线性查找的O(n)。二分法不仅用于查找，还广泛应用于求解各种数学和计算问题，如求方程的近似解、寻找最优解等。在计算机科学中，二分查找是最基础且最重要的算法之一，几乎所有程序员都需要熟练掌握。二、二分查找的基本原理二
河南萌新联赛2024第（四）场的个人题解（适合小白）耳朵听不见deaf ACM 算法
河南萌新联赛2024第（四）场的题目链接文章目录ABCEGIJKLAA题目链接思路： sum=计算原来每个连通块的士兵数量总和的平方。枚举每个点，若破坏当前点，当前点所在的连通块的计算值，记录ma=没破坏前的计算值-破坏后的计算值，记录最大值涉及的知识：tarjan算法不明白的话，可以看我的第二篇博客LCA算法有用的知识：__int128 占用128字节的整数存储类型，范围为-2127~2
快速排序算法追烽少年x 数据结构数据结构
快速排序算法快速排序是一种高效的排序算法，其核心思想是通过分治法将数组分成两部分，一部分小于某个基准值，另一部分大于基准值，然后递归地对这两部分进行排序。以下是快速排序算法的C++实现：快速排序的C++实现代码：#include#includeusingnamespacestd;voidSwap(int&a,int&b){intnTemp=a;a=b;b=nTemp;}intPartition(v
区块链技术核心组件及应用架构的全面解析
区块链技术是一套融合密码学、分布式系统与经济激励的复合型技术体系，以下是其核心组件及应用架构的全面解析：一、区块链核心技术栈1.分布式账本技术（DLT）核心原理：多节点共同维护不可篡改的数据链数据结构：哈希指针哈希指针区块N区块N+1区块N+2关键创新：默克尔树（MerkleTree）实现高效数据验证2.密码学保障技术算法示例应用场景非对称加密ECC/secp256k1,RSA数字签名（设备身份认
03每日简报20250705 Alvin_YD 每日简报人工智能娱乐社交电子媒体传媒
每日简报新闻简报：AI行业信任危机浮现标题：知名科技作者AlbertoRomero发文《我对AI行业正在失去所有信任》来源：TheAlgorithmicBridge（算法之桥）核心内容：作者立场：长期支持AI技术的作者AlbertoRomero公开表达对行业信任的崩塌，称"作为一个支持者，我本不愿有这种感受"。行业痛点：未具体说明的行业乱象导致公众信任度下降暗示AI发展过程中存在伦理或透明度问题传
正则表达式咸鱼时日翻身正则表达式
是指定一组与之匹配的字符串，限定符号a*a出现0或者多次a+a出现1次或者多次a？a出现0次或者1次a{2,5}出现在2到5次之间或运算法（cat|dog）匹配cat或者dog字符类[abz]+表示匹配的字符只能是中括号中的字母如果使用了^则为取反符号元字符、/d代表数字字符/w代表英文字符数字加上下划线/s代表tab和换行符其中/加大写的DWS则表示取反符号.表示任意字符不包括换行符号^a匹配行
定位问题position
1.relative相对对位：占有原来的位置。以浏览器为准定位进行移动top/left/right/bottom2.absolute绝对定位：不占有原来的位置（脱标）如果没有祖先元素或者祖先元素没有定位，以浏览器为准定位；如果祖先元素有定位（相对、绝对、固定），则以最近一级的有定位祖先元素为参考点移动位置；加了绝对定位的盒子不能通过margin：0auto垂直水平居中，但可以通过算法居中left：
【算法刷题记录（简单题）002】字符串字符匹配（java代码实现）挺菜的 java 算法开发语言
一、题目描述对于给定的字符串s和t，检查s中的所有字符是否都在t中出现。（一）输入描述第一行输入一个长度为1≤len(s)≤200、仅由小写字母组成的字符串s。第二行输入一个长度为1≤len(t)≤200、仅由小写字母组成的字符串t。（二）输出描述如果s中的所有字符都在t中出现，则输出true，否则输出false。（三）示例输入：bcabc输出：true二、题目解答（一）解题思路1.使用HashM
C语言数据结构与算法专栏目录 CodeAllen嵌入式嵌入式 C语言数据结构算法
后序会开一个《嵌入式数据结构专栏》主要为了学习嵌入式的同学，软件能力提升和大厂面试能力，感谢大家关注！直达专栏：https://blog.csdn.net/super828/category_11083370.html《C语言数据结构与算法》专栏已经更新完毕，共计72篇分享，后期会逐渐修改错误并添加内容0数据之间的关系有哪些？1如何度量一个算法的好坏？2常见的时间复杂度实例
分布式系统核心基石：CAP定理、BASE理论与一致性算法深度解析 Eqwaak00 分布式系统设计实战算法 python java
一、CAP定理：分布式系统的设计边界1.1核心定义与经典三角CAP定理（Brewer'sTheorem）指出，在分布式系统中，一致性（Consistency）、可用性（Availability）、分区容错性（PartitionTolerance）三者不可兼得。（注：若需实际配图，可替换为Mermaid流程图或专业示意图）三大特性详解：一致性（C）：所有节点在同一时间看到的数据完全相同（强一致性）。
LintCode算法刷题记录（入门 + 简单部分）隔壁敲代码的小王算法刷题笔记算法 LintCode
由于是初学者，实现的方法都很简单，暂时不考虑效率，之后（可能）会更新1.A+B问题给出两个整数aa和bb,求他们的和。样例如果a=1并且b=2，返回3。挑战显然你可以直接returna+b，但是你是否可以挑战一下不这样做？（不使用++等算数运算符）说明a和b都是32位整数么？是的我可以使用位运算符么？当然可以注意事项你不需要从输入流读入数据，只需要根据aplusb的两个参数a和b，计算他们的和并返
C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
求平方根：牛顿迭代法 mjfztms leetcode 算法
应用牛顿迭代法求解方程近似解，收敛速度很快牛顿迭代法求解平方根给你一个非负整数x，计算并返回x的算术平方根n，结果只保留整数部分。算法流程图由题意得，n2=xn^2=xn2=x，即为对f(n)=n2−xf(n)=n^2-xf(n)=n2−x求解。第一步：易得：x2−x1=0−f(x1)f′(x1)x_2-x_1=\frac{0-f(x_1)}{f'(x_1)}x2−x1=f′(x1)0−f(x1)
【秋招算法】2025 届搜广推方向求职历程（SSP、头部计划）秋冬无暖阳° 搜广推等—算法面经面试职场和发展算法
【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）文章目录【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）1.背景2.日常实习3.暑期实习3.1暑期BG3.2暑期记录4.秋招4.1秋招BG4.2转正4.3头部4.4提前批4.5正式批5.面试记录5.1Coding5.2其他高频编程题5.3常见八股、面经6.关于搜广推1.背景关于日常实习、暑期实习、提前批，秋招、春招、补招何为大
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round