SMO算法详细推导（Sequential Minimal Optimization）

本文针对一般性的“软判断的核函数的对偶问题的SVM”，形如下式：

上式问题所在：当采样点 $x_i$ 选取50000个点时，则基于核函数变量 $\bm{\Theta(x_i,x_j)}$ 将需要大约10GB的RAM来存储 $\bm{\Theta(x_i,x_j)}$ 。这里介绍前人所提的SMO算法，以降低存储空间。

一. 算法流程框架

首先，先给出SMO算法的算法流程，如下：

意思是：第一步，选取一对 $\alpha_i$ 和 $\alpha_j$ ，选取方法使用启发式方法。第二步，固定除 $\alpha_i$ 和 $\alpha_j$ 之外的其他参数，确定目标函数（即： $W(\alpha)$ 。图片中用 $W(\alpha)$ 表示整个目标函数）取得最大值时的 $\alpha_i^*$ 的取值，并由 $\alpha_i^*$ 计算出 $\alpha_j^*$ 。重复迭代上述两步，直到收敛。

SMO之所以高效就是因为在固定其他参数后，对一个参数优化过程很高效。

二. 符号定义与基础回顾

（1）先定义下述三个符号，以便后文表述：

SMO算法详细推导（Sequential Minimal Optimization）_第3张图片

（2）若为线性核函数分类，由基本二分类SVM可知，最后的分类是根据 $w^{*T}x_i+b^*$ 来判断的：若 $w^{*T}x_i+b^*>0$ 则判断 $y_i$ 属于某一类，若 $w^{*T}x_i+b^*<0$ 则判断 $y_i$ 属于另一类。如果是非线性核函数分类，则是 $w^{*T}\phi(x_i)+b^*$ 与0的大小比较（但是，在实际核函数模型中，我们没有 $\phi(\bm x_i)$ 的表达式，往往都是直接给出 $\bm{\Theta(x_i,x_j)}$ (而： $\bm{\Theta(x_i,x_j)}$ = $\phi(\bm x_i)^T\phi(\bm x_j)$ )。因此， $w^{*T}x_i+b^*$ 仅用于线性核函数中，而在非线性核函数里，并不用 $w^{*}$ 来判断分类的结果。虽然不用，但为了完整性，这里还是给出核函数下的 $w^{*}$ ）， $\bm w^*$ 的具体表达式为：

$\begin{aligned} \bm{w^*}=\sum_{i}^{}\alpha_i^*y_i\phi(\bm x_i) \end{aligned}$

而对标量 $b^*$ 的计算，书上式子(2.75)写道：

SMO算法详细推导（Sequential Minimal Optimization）_第4张图片

（3）符号 $E_i$ 定义如下：

$\begin{aligned} E_i &=f(\bm x_i)-y_i\\&=(\sum_{j=1}^{n}y_j\alpha_jK_{ij}+b)-y_i \\&=(\sum_{j=1}^{n}y_j\alpha_j\phi(x_j)^T\phi(x_i)+b)-y_i \\&=(w^{*T}\phi(x_i)+b)-y_i \end{aligned}$

显然， $E_i$ 是函数 $f (x)$ 对输入 $x_i$ 的预测值与真实输出值 $y_i$ 之差。（备注：1998年原始参考文献中，预测值 $f(x_i)$ 用 $u_i$ 表示的，即 $E_i=u_i-y_i$ ）

三. 整理目标函数

SMO算法详细推导（Sequential Minimal Optimization）_第5张图片

四. $\alpha_2^{new}$ 的推导(不考虑范围约束时)

由于下述约束条件成立：

因此，有

其中， $C^{'}$ 是常数。根据式子(2.142)，可知：
$\begin{aligned} \alpha_1 = \gamma -s\alpha_2 \end{aligned}$

其中 $\gamma=C'y_1$ 、 $s=y_1y_2$ （因为 $y_1$ 只能取+1或-1，因此，除以 $y_1$ 等价于乘以 $y_1$ ）。带入消除 $\alpha_1$ 后，我们可将式子(2.141)重新整理为下式：

SMO算法详细推导（Sequential Minimal Optimization）_第6张图片

将上式对 $\alpha_2$ 求导，并令其为0，得到下式：

解出上式中的 $\alpha_2$ 为：

SMO算法详细推导（Sequential Minimal Optimization）_第7张图片

上式(2.145)中， $\alpha_2$ 有个上角标，是表示此为更新后的 $\alpha_2$ ，或者说是最优的 $\alpha_2$ ，用 $\alpha_2^{new}$ 表示。

上式经过下面照片中的推导可以化简，详细推导过程见照片(可省略不看)：

SMO算法详细推导（Sequential Minimal Optimization）_第8张图片

推导结果为：（此结果也是1998年中论文的结果）

五. $\alpha_2^{new,revised}$ 的推导

显然，上述分析没有考虑式子(2.97)的约束条件，换句话说， $\alpha_2^{new}$ 很可能不在指定区域 $[0, C]$ 内，而由于此时已经转化为一元函数求极值问题，所有，如果极点不在区域内，那么最值一定取在边界点，所有，最优的 $\alpha_2$ 的取值不再是 $\alpha_2^{new}$ ，应该换符号表示，文中采用 $\alpha_2^{new,revised}$ 表示考虑式子(2.97)中约束的新更新变量。故为了分析式子(2.97)的约束条件，有下述两个公式：

（1）当 $y_1$ 与 $y_2$ 异号时

（2）当 $y_1$ 与 $y_2$ 同号时

解释一下上述公式：
首先将式子(2.142)两侧同时乘以 $y_1$ ，由于 $y_1$ 只能取正负1，故，分类讨论：
（1）解释：当 $y_1$ 与 $y_2$ 异号，所以有：
$\begin{aligned} \alpha_1+\alpha_2=\gamma \end{aligned}$

由于 $\alpha_1$ 与 $\alpha_2$ 只能取[0,C]之间的box内，所以，此时有两种情况，如图：

SMO算法详细推导（Sequential Minimal Optimization）_第9张图片

（2）解释：当 $y_1$ 与 $y_2$ 同号时，有：

SMO算法详细推导（Sequential Minimal Optimization）_第10张图片

综合上述两种情况，我们有：

SMO算法详细推导（Sequential Minimal Optimization）_第11张图片

此时得到的 $\alpha_2^{new,revised}$ 是完全符合题意的最优的 $\alpha_2$ 值！下面回带如公式，反求最优的 $\alpha_1$ 。

六. $\alpha_1^{new}$ 的推导

由于式子 (2.142)成立(且，算法流程中已提及，叠代 $\alpha_1$ 与 $\alpha_2$ 时，需要固定其余参数，即 $\alpha_3$ 到 $\alpha_n$ 是固定不变的，只叠代 $\alpha_1$ 与 $\alpha_2$ )，因此，迭代前后的 $\alpha_1$ 与 $\alpha_2$ 都满足下式：

$\begin{aligned} y_1\alpha_1^{old}+y_2\alpha_2^{old}=C' \end{aligned}$

$\begin{aligned} y_1\alpha_1^{new}+y_2\alpha_2^{new}=C' \end{aligned}$

所以有：

$\begin{aligned} y_1\alpha_1^{old}+y_2\alpha_2^{old}=y_1\alpha_1^{new}+y_2\alpha_2^{new} \end{aligned}$

上述左右同时乘以 y1，可解出 $\alpha_1^{new}$ 如下：

七. KKT条件

下式KKT条件中的 $f(x_i)$ ，代表在当前 $w$ 这个分类准则下，输入为 $x_i$ 时，输出的分类预测结果。

SMO算法详细推导（Sequential Minimal Optimization）_第12张图片

（此处的KKT推导见2001年论文即可！）这个KKT条件说明，在两条间隔线外面的点，对应前面的系数 $\alpha_i$ 为0（即距离线很远且不起作用的点），在两条间隔线里面的对应 $\alpha_i$ 为C，在两条间隔线上的对应的系数 $\alpha_i$ 在0和C之间。

八. $b$ 的推导

（1）先说结论：

SMO算法详细推导（Sequential Minimal Optimization）_第13张图片

解释为什么 $\alpha_1^{new}$ 和 $\alpha_2^{new,clipped}$ 在界内时（ $0<\alpha_i^{new}0<αinew<C$

SMO算法详细推导（Sequential Minimal Optimization）_第14张图片

（2）再说结论的证明过程：

SMO算法详细推导（Sequential Minimal Optimization）_第15张图片

SMO算法详细推导（Sequential Minimal Optimization）_第16张图片

之所以要更新 $E_i$ ，是因为这个变量有两个作用，一是用以作为第二个乘子的选取因子；二是用以作为判断算法终止的条件！

九. SMO应用流程

下面是SMO算法详细流程，该流程比本文第一节中的要详细，可用于实际应用中：

SMO算法详细推导（Sequential Minimal Optimization）_第17张图片

SMO算法详细推导（Sequential Minimal Optimization）_第18张图片

其中，用启发式算法选取点的原则为：

SMO算法详细推导（Sequential Minimal Optimization）_第19张图片

十. 其余说明：

（1）论文中说，如果采用的是线性核函数，那么久按照如下方式更新 $\bm w^{new}$ ：

$\begin{aligned} \bm w^{new}=\bm w+y_1(\alpha_1^{new}-\alpha_1)\bm x_1+y_2(\alpha_2^{new,revised}-\alpha_2)\bm x_2 \end{aligned}$

上式的结论依据以下两个公式便可得到：

SMO算法详细推导（Sequential Minimal Optimization）_第20张图片

看完这句话以后我误会了好久，仔细看公式才发现，之所以文中说“线性核函数”才更新 $\bm w^{new}$ ，是因为这里的更新公式中没有 $\phi(.)$ ，换言之，并不是 $\bm w$ 只能用于线性，而是这里的公式没有加核，所以，这个公式里的 $\bm w$ 只能用于线性。若改为下式，则任何满足题意的核，都可以用此式来分类：

$\begin{aligned} \bm w^{new}=\bm w+y_1(\alpha_1^{new}-\alpha_1)\bm \phi(x_1)+y_2(\alpha_2^{new,revised}-\alpha_2)\bm \phi(x_2) \end{aligned}$

（按照更新 $\alpha_1$ 与 $\alpha_2$ 的方式，来更新所有需要更新的 $\alpha_i$ ，全部训练并更新完后，便可将该模型用于分类，最终的 $\bm w^{new}$ 可按照上述更新两个参数的方式来推导，但是正如前文所述说，实际中直接给出的是 $\bm{\Theta(x_i,x_j)}$ 的矩阵取值（ $\bm{\Theta(x_i,x_j)}$ = $\phi(\bm x_i)^T\phi(\bm x_j)$ ），并非 $\phi(\bm x_i)$ 。因此，非线性核函数下的 $\bm w^{new}$ 没有实际用处，仅用于求解 $b^{new}$

（2）另外一个待更新资料：

SMO算法详细推导（Sequential Minimal Optimization）_第21张图片

下文中，迭代的终止条件是两次叠代的 $\alpha_{old}$ 与 $\alpha_{new}$ 所对应的 $f_i^{old}$ 与 $f_i^{new}$ 之间的数值小于某个数时，则终止叠代。毕竟选取的 $\alpha_1$ 都是那些不满足KKT条件的，当都满足以后，自然每次叠代 $\alpha$ 后，其 $f$ 改进就会很小了。

SMO算法详细推导（Sequential Minimal Optimization）_第22张图片

算法中，各个所需的阿尔法求解完毕后（即样本训练结束以后），最终应用时分类的原则为：

SMO算法详细推导（Sequential Minimal Optimization）_第23张图片

十一. SMO改进（个人记录）：

问题所在：(举例)

SMO算法详细推导（Sequential Minimal Optimization）_第24张图片

计算如下：（为了清晰地凸显出1998年SMO的缺点，下文的更新中，同时叠代了 “传统的 $b$ ” 和 “新颖的 $b_{low}、b_{up}$ ”）

（1）第一次迭代更新计算：
此时所有 $\alpha$ 都为0，初始类别为 $y_1=-1; y_2=+1;y_3=+1$ ，因此可计算得： $F_1=1; F_2=-1;F_3=-1$ ，1,2,3三个样本点分别属于 $I_4、I_1、I_1$ ，因此 $b_{low}=1、b_{up}=-1$ 。由于 $\alpha$ 都为0，因此 $f(x_i)=\sum_{j=1}^{n}{y_j\alpha_jK_{ij}-b=-b=0}$ (i=1,2,3)，因此由公式 $E_i=f(x_i)-y_i$ 计算得： $E_1=1; E_2=-1;E_3=-1$ 。此外，容易计算初始状态的三个节点都违背KKT条件。

（2）第二次迭代更新计算：
$\alpha_2^{new}=0+\frac{1(1+1)}{1+1-0}=1$
$L=max(0,\alpha_2-\alpha_1)=0$
$H=min(C,C+\alpha_2-\alpha_1)=C=\frac{1}{4}$
$\alpha_2^{new,clipped}=H=C=\frac{1}{4}$
$\alpha_1^{new}=0+(-1)(0-\frac{1}{4})=\frac{1}{4}$

因此，可知， $\alpha_1^{new}=\alpha_2^{new}=C$ ，此时都是上界！（按照传统SMO中所提的算法，此时的b的更新公式为 $b_1$ 与 $b_2$ 的平均值）。下面继续更新叠代：
$F_1=\sum_{j=1}^{n}{\alpha_jy_jK_{1j}-y_1=\frac{1}{4}(-1)(1)+0+0+1=\frac{3}{4}}$
$F_2=0+\frac{1}{4}(1)(1)+0-1=-\frac{3}{4}$
$F_3=0+\frac{1}{4}(1)(2)+0-1=-\frac{1}{2}$

下面按照1998年论文的步骤更新参数 $b$

SMO算法详细推导（Sequential Minimal Optimization）_第25张图片

$b_1^{new}=1+(-1)(\frac{1}{4}-0)(1)+(1)(\frac{1}{4}-0)=\frac{3}{4}$
$b_2^{new}=-\frac{3}{4}$

注意，若仔细按照《统计学习方法》中的步骤推导b的公式，则发现，其实这里b的更新公式中，用到的 $E_i$ 其实是 $E_i^{old}$ ，正因为是old，所以b中的公式里才要减去old并加上new的那一项，因此，标准低来写，上图中，用以计算 $b_1$ 和 $b_2$ 的公式（20）和公式（21）的实质由下式化简而来： $b_1^{new}=f^{new}(x_i)-y_i$ ，其中的 $f^{new}(x_i)$ 中是更新后的新 $\alpha$ 计算的，带入后就分别等于公式（20）和公式（21）了。（其中， $f^{new}(x_1)=\sum_{j=1}^{3}{y_j\alpha_jK_{ij}-b^{old}=(-1)(\frac{1}{4})(1)+0+0-0=-\frac{1}{4}}$ 或者也可以直接用 $f^{new}(x_1)=b_1^{new}+y_1=-\frac{1}{4}$ ，同理， $f^{new}(x_2)=\frac{1}{4}$ ， $f^{new}(x_3)=\frac{1}{2}$ ）。注意！！！上述 $f^{new}(x_i)$ 的取值并没有在SMO代码中出现，换句话说，下一轮迭代时所采用的 $f^{new}(x_i)$ 并不是上述计算的取值，上述的取值只是理论上的 $f^{new}(x_i)$ ；而在传统SMO中实际运行时的 $f^{new}(x_i)$ 由于使用了不恰当的b（即： $b=\frac{b_1+b_2}{2}$ 更新的），而出现弊端，这也正是2001年论文的精髓所在，具体在第三次迭代中详细说明。论文的截图中， $b^{new}$ 的计算用的是 $F_1$ 与 $F_2$ 的均值，并非 $b_1$ 与 $b_2$ 的均值，这是因为，在更新 $b_1$ 与 $b_2$ 时，我们假设了此时的两个 $\alpha$ 都位于界内（即0与C的开区间上），而界内的含义是该样本点表示支撑向量！根据KKT条件中的第二个限制可知（看本博客上方的KKT，或参见《统计学习方法》中的公式7.112）此时的 $y_if(x_i)=1$ ，我们若将此式左右同乘以 $y_i$ ，则有： $f(x_i)=y_i$ ，即： $f(x_i)-y_i=0$ ，而根据 $E_i$ 定义， $E_i=f(x_i)-y_i$ ，所以我们可知，对满足KKT条件且在界内的样本点而言，其误差 $E_i=0$ ，而论文中有如下定义：

$E_i=f(x_i)-y_i=F_i-\beta_i$
上述公式说明： $E_i=f(x_i)-y_i$ 是1998年论文的定义。 $E_i=F_i-\beta_i$ 是2001年论文的定义，两者相等是显然的，因为 $F_i=\sum_{j=1}^{n}{\alpha_jy_jK_{ij}-y_i}$ ，而 $f(x_i)=\sum_{j=1}^{n}{\alpha_jy_jK_{ij}-b}$ ，且 $b=\beta$ 。

因此，在该限制条件下（界内且满足KKT，由于19981年中loop1与loop2的叠代保证会使得参数满足KKT）， $F_i=\beta_i$ ，所以，2001年论文中，计算b才有截图所示的 $\beta=\frac{F_1+F_2}{2}=\frac{(-\frac{3}{4})+\frac{3}{4}}{2}=0$ 。

此时继续更新，由于此时的 $\alpha_1=C$ ， $\alpha_2=C$ ， $\alpha_3=0$ ，再结合仍然不变的 $y_1=-1; y_2=+1;y_3=+1$ ，因此，此三个样本点分别属于 $I_2$ 、 $I_3$ 、 $I_1$ 。并且此时的三个 $F_i$ 已经计算好了。因此，根据 $b_{up}$ 和 $b_{low}$ 的计算公式，可知：
$b_{up}=min{\{\frac{3}{4},-\frac{1}{2}}\}=-\frac{1}{2}$
$b_{low}=max{\{-\frac{3}{4}}\}=-\frac{3}{4}$

（3）第三次迭代更新计算：
此时我们会惊奇地发现，用原始的b来计算时，我们发现原本计算好的 $\alpha$ 又不满足了KKT条件…究其原因是因为b的选取不合适，因此才需要用 $b_{low}、b_{up}$ 代替。若按照传统SMO代码来更新 $f^{new}(x_i)$ ，则要用到上文计算的b，其中的b=0（由公式 $\beta=\frac{F_1+F_2}{2}=\frac{(-\frac{3}{4})+\frac{3}{4}}{2}=0$ 计算而来！并没有采用上文中的 $b_i^{new}$ ，这里与上文加粗字体处相呼应！），因此，传统SMO计算 $f^{new}(x_i)$ 公式如下：

$f^{new}(x_1)=\sum_{j=1}^{3}{y_j\alpha_jK_{1j}-\beta}=-\frac{1}{4}$

SMO算法详细推导（Sequential Minimal Optimization）_第26张图片

论文中说此时，用 $\beta=0$ 计算时，违背了KKT，但是我验证好像没有违背啊？？？但是后来该大佬重复发表的此篇论文中，没有这个例子了。

即使这个例子不合理，但是这个事实是成立的！因此，在1998年的SMO中，才有不断地循环loop2的事情，一直到loop2中所有参数都满足KKT后，才能重新循环loop1，并更新新的参数！而不断循环loop2的原因就在此，即b的选取是病态的，尤其是当 $\alpha$ 的取值在边界上（ $\alpha=C$ 时），此时最容易出现b取值不合理，正因为b的不合理，因此导致loop2不断地迭代循环，一直到所有参数都满足KKT才结束，才能让examineAll=1并执行loop1。

2001年论文中的其余注意事项：

第二次读2001年论文的感悟：

注意，不是原来的β不正确，而是KKT的判断中有β的参与而导致低效！因此，本文更改KKT的判断，令其脱离β！因此，将β从KKT公式中分离出来，然后比较β两侧的大小关系即可！由此实现高效的SMO叠代！！！
（发现第一次读的理解有偏差…）

参考资料：
[1] 《Sequential Minimal Optimization:
A Fast Algorithm for Training Support Vector Machines》作者：John C. Platt 时间：1998 （SMO原文）
[2] 《Selected Applications of Convex Optimization》作者：Li Li
[3] 学习网址1
[4] 学习网址2
[5] SMO算法的matiab代码下载网址1
[6] SMO算法的matiab代码下载网址2
[7] SMO算法的matiab代码下载网址3
[7] 从SVM到SMO详细讲解
[8] 简化的SMO伪代码
[9] C_SVC 和 V_SVC区别

如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
大伟说成语之唉声叹气求索大伟
＊大伟说成语＊【唉声叹气】叹气：因心里不痛快或不如意而吐出长气，发出声音。因为痛苦、憋闷或感伤而发出叹息的声音。【大伟说】情绪外露，非人类所特有，动物亦有情绪，悲哀和欢乐所表示的情绪亦是不一样的，会嗷嗷大叫也会低吟痛哭。不同的是，人类的情绪更复杂，更多样，更丰富。唉声叹气，可以说是最基础的情绪，因为无奈而举足无措，不知该如何如何化解，只有独自一人慢慢承受，长吁短叹不知如何是好，其实是无能无力的表现
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
Rust基础知识 GRKF15 rust 开发语言后端
1.Rust语言简介1.1基础语法变量声明：let关键字用于声明变量，可以指定或不指定类型，如leta=10;和letmutc=30i32;。函数定义：使用fn关键字定义函数，并指定参数类型及返回类型，如fnadd(i:i32,j:i32)->i32{i+j}。控制流：包括if、else等，控制语句后需要使用;来结束语句。1.2数据类型整数类型：i8、i16、i32、i64、i128，以及无符号的
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
2021-01-24 9ce517ee104c
【打卡素材】《香帅金融学讲义》【标题】公司治理：怎样同床异梦地过下去【日期】2021.1.24【字数】公司本质上是一连串的合约关系。降低合同执行中的各种摩擦是公司正常有效运行的基础。协同各方的利益、制衡各方的权力是关键。为解决利益冲突问题、协同各方利益，进行权力制衡的机制设计就是公司治理机制。001什么是公司治理治理是管理的基础，治理机制越好，权、责、利就越清晰，管理的目标也就会更容易实现。002
如何在心上用功？余超林AIA财富管家
思考：如何在心上用功？学习心得：心-道-德-事的理解心-道-德-事这四部曲，本质上就是一个人的思维智慧的四个层面：事是最底层，这是所有人在这个社会谋求生存的基础，一个人能够把事情彻底做好，保质保量的完成，才会有真正的结果，但是这个层面要获得真正成功很困难，因为会做事的人很多，最终会出现恶性竞争；德是第三层，如果说整个社会做事的竞争激烈程度为100%，那么上升到德上的竞争激烈程度降低为80%，德是一
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
第二十 python基础--语句九樱MOL
目录具体内容1：if语句的使用格式判断语句2：if-else的使用格式3：if-elif-else的使用格式4：if嵌套1：while循环的格式循环语句2：while循环嵌套3：for循环的格式一、判断语句在程序中如果某些条件满足，才能做某件事情，而不满足时不允许做，这就是所谓的判断1.1if语句的使用格式if要判断的条件:条件成立时，要做的事情案例:判断年纪，如果age大于18，输入成年age=
(179)时序收敛---＞(29)时序收敛二九 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛二九（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）
(180)时序收敛---＞(30)时序收敛三十 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛三十（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）
(158)时序收敛---＞(08)时序收敛八 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛八（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
(159)时序收敛---＞(09)时序收敛九 FPGA系统设计指南针 FPGA系统设计(内训)fpga开发时序收敛
1目录（a）FPGA简介（b）Verilog简介（c）时钟简介（d）时序收敛九（e）结束1FPGA简介（a）FPGA（FieldProgrammableGateArray）是在PAL（可编程阵列逻辑）、GAL（通用阵列逻辑）等可编程器件的基础上进一步发展的产物。它是作为专用集成电路（ASIC）领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。（b）F
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本