# JFZero

机器学习——SMO算法推导与实践

一、硬间隔-SMO算法推导

明天再说，啊。。。。感觉天空明朗了很多，即使现在已经很晚了
还是要打开柯南，看看电视，等待天气预报所说的台风天吧！

一时之间，忽然失去了用markdown语法写下推导过程的勇气。。。以上只是自己在线性可分的情况下，推导的smo算法但实际书本上给出的smo算法，是增加了软间隔后的smo算法
以上只是理解版本的推导，但实际要用在程序上理解，绝不能这么不严谨
是的，我现在终于理解为什么为什么为什么课本要列出那么多奇奇怪怪的符号
那都是非常简便的表达方式！
看了自己手动推的乱七八糟SMO，再看看人家推导的！SMO保姆级教学
我终于发现自己推导的漏洞百出
哭了，哭着重新在草稿纸继续推导吧~

最后拉格朗日对偶问题，是要求解
$MAX_λL(λ)=∑λ_i-\frac{∑_{i=1}^n∑_{j=1}^nλ_iλ_jx_ix_jy_iy_j}{2}$
即，通过调整λ值，求解L函数极大值

而 $M a x : L$ 可以转化为求 $M in : - L$ ，即求解 $Min_λL(λ)=\frac{∑_{i=1}^n∑_{j=1}^nλ_iλ_jx_ix_jy_iy_j}{2}-∑λ_i$

接下来，采用SMO算法，求解 $M in : L$
①使最终数据符合KKT条件：

$λ g (w, b) \leq 0, 且要保证 λ \geq 0 ，因此 KK T 条件的判断具体分为以下两种$
- $λ_i＞0时，g(w,b)=0，即1-y_i*(Wx_i+b)=0$
- $λ_i = 0时，g(w,b)≤0，即1-y_i*(Wx_i+b)≤0$

②λ要始终满足 $Σλ_iyi=0$

SMO算法思想:迭代+贪心

由于每条数据都对应一个λ值，即 $x_i,y_i,λ_i$ ，因此假设有n条数据，就有n个λ，直接求导非常困难

SMO算法提出：每次迭代2个λ，确保这2个λ都在自己能力范围内，都尽可能使L(λ)函数值达到最优，且始终保持 $Σλ_iyi=0$

这就像是贪心算法，局部最优，最终全局最优
简单点：每个人都拼尽全力让社会更美好，那么社会才会达到最美好
每道题都拿最高分，你就是rolling king or rolling queen
SMO思想，甚至还有先富带后富的先进理念，我无法同时让λ达到状态，但我可以每次2个，既可以保证 $Σλ_iyi=0$ ，还可以逐次使L达到最优

1. 算法步骤总览

明确SMO的迭代+贪心的思想后，就可以简化为以下几个步骤：

①未知参数赋初值：
②选择2个迭代λ（用λ_1,λ_2分别代表选中的2个λ）
③求解迭代后的λ，并判断是否满足λ≥0条件
④计算当前的 $W_{new},b_{new}$
⑤若全部满足KKT条件，或达到迭代次数，则停止SMO算法

看似简单的步骤，实则难于上青天

①未知参数赋初值

λ：λ_i全赋值为0，这样即可保证 $Σλ_iyi=0$
W： $W=∑λ_ix_i*y_i，因此W也全为0$
b：b没有条件限制要求，可以直接赋值为0

【需要注意：λ的个数为n，表示n条数据就有n个λ，W的个数为影响因素的个数（即有m种x，就有m个W）】
例如性别、年龄、收入这三个影响因素x，决定幸福感y，那么W就有3个

②选择2个迭代λ（用λ_1,λ_2分别代表选中的2个λ）

λ1的选择方式：选择最偏离KKT条件的λ

如何判断偏离KKT条件的程度？

$λ g (w, b) \leq 0, 且要保证 λ \geq 0 ，因此 KK T 条件的判断具体分为以下两种$
- $λ_i＞0时，g(w,b)=0，即1-y_i*(Wx_i+b)=0$
- $λ_i = 0时，g(w,b)≤0，即1-y_i*(Wx_i+b)≤0$
- 首先是违反KKT条件，其次违反程度通过g(w,b)值来衡量，即选择max:g(w,b)下的 $λ_i$
  但建议还是将违反KKT条件的程度，降序排列得到一个违反KKT条件的g(w,b)降序列表
- 这样，如果g(w,b)的最大值对应的λ1不满足迭代条件时，还可以退而求其次，选g(w,b)第二大对应的λ1
- 【判断1】若选不到λ1，说明所有λ都满足KKT条件，可停止SMO算法
λ2的选择方式：选择能使λ2改变最大的λ
- 公式推导出的 $λ2_{new}=λ2_{old}+\frac{y_i*(E1-E2)}{K11+K22-2K12}$ ，当 $∣ E 1 - E 2∣ 大$ 说明这两条对应的数据差距比较大【后续再公式推导】
- 【判断1】若当前|E1-E2|最大的λ2不满足条件要求，则重选λ，即退而求其次选|E1-E2|第二大对应的λ2
- 【判断2】若选不到λ2，则重新选λ1，再选λ2
  - 重选λ1，是指选下一个偏离KKT条件的λ，而不是最偏离了【降序选择λ1】

$λ2_{new}$ 的公式推导：

求解 $Min_λL(λ)=\frac{∑_{i=1}^n∑_{j=1}^nλ_iλ_jx_ix_jy_iy_j}{2}-∑λ_i$ ，已知所有λ均有初值

那么单独挑出λ1、λ2作为未知量来求L极值，并迭代，则需将其余的λ3…λn都当作常数

未知量：λ1、λ2
常数：λ3…λn
实际λ1、λ2本身是有旧值的，但我们要求解的是它们的新值，因此当作未知量来求导

step1: 因此先分离出L(λ)里含λ1和λ2的项，再进行求导：

第一部分： $\frac{1}{2}∑_{i=1}^n∑_{j=1}^nλ_iλ_jx_ix_jy_iy_j$
$=\frac{1}{2}[ λ_1^2y_1^2x_1.x_1+λ_2^2y_2^2x_2.x_2+2λ_1λ_1y_1y_2x_1.x_2+2(λ_1y_1x_1+λ_2y_2x_2)∑^n_{i=3}λ_iy_ix_i+∑_{i=3}^n∑_{j=3}^nλ_iλ_jx_ix_jy_iy_j]$

注： $x 1. x 1$ 中间的点，表示点积，因为 $x_i$ 本身是向量，向量相乘即为点积运算

第二部分： $∑λ_i=λ_1+λ_2+∑^n_{i=3}λ_i$

step2: 后续求导常数无用则删: 将第一、二部分常数删去后，再拼接成只含迭代变量的Q(λ1，λ2）函数

$\frac{1}{2}[ λ_1^2y_1^2x_1.x_1+λ_2^2y_2^2x_2.x_2+2λ_1λ_1y_1y_2x_1.x_2+2(λ_1y_1x_1+λ_2y_2x_2)∑^n_{i=3}λ_iy_ix_i]+λ_1+λ_2$

step3: 将Q函数变为只含一个未知λ，再求导

由 $Σλ_iyi=0$ 可得： $λ_1y_1+λ_2y_2=-∑^n_{i=3}λ_i=-λ_{1old}y_1-λ_{2old}y_2$

这里的λ1、λ2表示未知量， $λ_{1old},λ_{2old}$ 则表示它们的旧值

$∑^n_{i=3}λ_i=λ_{1old}y_1+λ_{2old}y_2，可视为常数 A，方便简化计算$

给 $λ_1y_1+λ_2y_2=-A$ 两边乘以y1，并移项可得:λ1 = -λ2y1y2-Ay1

将 $λ 1 = - λ 2 y 1 y 2 - A y 1 代入 Q 函数$ ，即可得到只含未知量λ2的Q函数，并对λ2求导后，整理可得

$Q'_{λ2} = hahahahhahahahhahah放弃markdown语法写推导，太长辣救命$

然后再将 $A=∑^n_{i=3}λ_i$ 代入 $Q'_{λ2}$ ，并令 $Wx_i+b-y_i = E_i，表示预测值与真实值的差距$

则令 $Q'_{λ2} =0$ ，最终整理出 $λ_{2old}+\frac{y2*(E1-E2)}{x1.x1+x2.x2-2x1.x2}$

③求解迭代后的λ，并判断是否满足迭代条件

λ的条件要满足：λ≥0，即求解出的λ1、λ2都要满足≥0的条件

通过上一步可得到 $λ_{2old}+\frac{y2*(E1-E2)}{x1.x1+x2.x2-2x1.x2}$

因此可先判断λ2≥0：

如果λ2≥0，即继续往下
如果λ2不满足条件，则返回重选λ2

接着判断λ1，由 $λ_1 = -λ_2y_1y_2-Ay_1≥0$ 可得

当y1y2 = 1时： $λ2≤-Ay_1$
当y1y2 = -1时： $λ2≥Ay_1$
如果满足任意一个条件，则继续往下
如果以上两个条件都不满足，则返回重选λ2

④计算当前的 $W_{new},b_{new}$

计算出满足λ≥0的λ1和λ2后，可代入求解最新的 $W_{new}$

$W_{old} = λ_{1old}y_1x_1+λ_{2old}y_2x_2+∑^n_{i=3}λ_iy_ix_i$

$W_{new} = λ_{1}y_1x_1+λ_{2}y_2x_2+∑^n_{i=3}λ_iy_ix_i$

则 $W_{new} = W_{old}+(λ_{1}-λ_{1old})y_1x_1+(λ_{2}-λ_{2old})y_2x_2$

可见，每次W的更新，都只与选择的两个λ有关

$b_{new}$ ，表示两条边界上的b1和b2的中间值

怎么判断是不是边界呢？

其实也就是当λ>0的时候，因此λ>0，则g(w,b)=0，这在之前的拉格朗日乘数法中已证明为支持向量，即边界

因此，则当λ1、λ2均大于0时，根据 $g(w,b) = 1-y_i(W_{new}x_i+b) = 0$

求出
$b_{1new}= y_1-W_{new}x_1$
$b_{2new}= y_2-W_{new}x_2$

则 $b_{new} = \frac{b_{1new}+b_{2new}}{2}$

⑤若全部满足KKT条件，或达到迭代次数，则停止SMO算法

硬间隔情况下的推导比较简单，但实践起来困难重重，并且有些是想不通的
1、选出违反KKT条件最严重的λ1，再选出|E1-E2|值最大的λ2，但计算出的 $λ1_{new}、λ2_{new}$ 并不满足λ≥0的条件，因此需要重新选λ，但要怎么重新选呢？

先重新选λ2：将所有λ的|E1-E2|进行降序排列，再依次选择对应的λ2，直到 $λ1_{new}、λ2_{new}$ 都满足λ≥0

如果所有的|E1-E2|>0的λ都选择了个遍，却依然无法满足λ≥0，则说明当前的λ1暂时选不出合适的λ2

则可以重新选择λ1，重新选择的是违反KKT条件程度第二的λ

如果选到了合适的λ2，则在完成λ1、λ2的迭代后，返回重新选λ1、λ2，开始新一轮的迭代。

但在实践过程中，即使数据是线性可分的，可一旦数据量很多的时候，就很难收敛了，并且经常在几个数据里来回震荡，无法完全满足KKT条件的同时还能满足迭代后的λ≥0

于是，为了解决这个问题，采取了限定迭代次数的方法

并且测试时，自己设计了线性关系，哎。。。总之就是
如果只有一个影响因素x，并且成线性关系时，数据量少的情况下（测试10条），是可以完全准确分类的。。。。

但是训练的过程。。。真的好慢好慢好慢啊。。。。只要我多加一个新的线性影响因素，还是10条数据。。。。。就会慢的要死，并且还很难收敛到所有λ都满足KKT条件，只有到10000次迭代次数自动停止后，才结束训练，不过好在10条数据内，2个影响因素，都还是100%的分类准确率
我甚至不敢测试多几条数据。。。。但还是英勇的选择了100条数据进行训练…
果然还是无法完全收敛满足KKT条件，超过迭代次数后停下来的
最终准确率还是降低了…差不多就得了…实际它都没迭代完。。。但数据量实在太大了

import numpy as np
import pandas as pd
import random
import matplotlib.pyplot as plt
import time
# 获取所需数据：
datas = pd.read_excel('./datas6.xlsx')
important_features = ['推荐分值','专业度','推荐类型']
# datas = pd.read_excel('./datas5.xlsx')
# important_features = ['推荐分值','推荐类型']

datas_1 = datas[important_features].head(100)
Y = datas_1['推荐类型']
X = datas_1.drop('推荐类型',axis=1)
X_features = X.columns
Y_features = '推荐类型'
rows,columns = datas_1.shape

Y=Y.where(Y!="高推荐",other=1) # 高推荐设置为1
Y=Y.where(Y!="低推荐",other=-1) # 低推荐设置为-1

class SMO():
    def __init__(self,X,Y):
        self.X = X
        self.Y = Y
        self.m = X.shape[1]
        self.n = Y.shape[0]
        self.lamb = np.zeros(self.n)
        self.b = 0
        self.W0 = np.zeros(self.m)
        self.times = 10000
        self.Finish = False
        self.break_kkt = {}
        self.break_kkt_list = []
        self.E = None


    def count_break_KKT(self):
        del self.break_kkt
        self.break_kkt = {}
        self.g = 1-self.Y*((self.W0*self.X).sum(axis=1)+self.b)
        # time.sleep(3)
        for index,g_value in self.g.items():
            a = self.lamb[index]
            if a < 0:
                raise Exception(f"lamb1_new为{lamb1_new},还是小于0")
            elif a == 0 and g_value>0:
                self.break_kkt[index] = abs(g_value)
            elif a > 0 and g_value!=0:
                self.break_kkt[index] = abs(g_value)


    def run(self):
        select_lamb1 = False
        while not self.Finish and self.times>0:
            if len(self.break_kkt_list) == 0:
                self.count_break_KKT()
                self.break_kkt_list = sorted(self.break_kkt.items(), key=lambda d: d[1], reverse=True)
                if len(self.break_kkt_list) == 0:
                    print("已全部满足KKT")
                    break
            # print(f"当前违反KKT条件的：{self.break_kkt_list}")
            # time.sleep(3)
            index1 = self.break_kkt_list.pop(0)[0]
            x1 = self.X.iloc[index1]
            y1 = self.Y[index1]
            lamb1_old = self.lamb[index1]
            self.E = (self.W0 * self.X).sum(axis=1) + self.b - self.Y
            e1 = self.E[index1]
            self.E1E2_all = e1-self.E
            self.E1E2_abs = (e1-self.E).abs()
            self.E1E2_sort = sorted(self.E1E2_abs.items(), key=lambda d: d[1], reverse=True)
            # print(f"当前的E1E2排序：{self.E1E2_sort}")
            # time.sleep(3)
            self.times -= 1
            for j in self.E1E2_sort:
                index2 = j[0]

                x2 = self.X.iloc[index2]
                y2 = self.Y[index2]
                lamb2_old = self.lamb[index2]
                e1_e2 = self.E1E2_all[index2]
                # print(f"选中的第{index1}和第{index2}的E差值为{e1_e2},参数：{self.lamb[index1], self.lamb[index2]}")
                # time.sleep(3)
                if e1_e2 == 0:
                    # print(f"由于两者的E差值为0，因此不进行迭代")
                    select_lamb1 = True
                    break
                temp = sum(x1*x1+x2*x2-2*x1*x2)
                A = -lamb1_old*y1-lamb2_old*y2
                if temp==0:
                    # print("当前的index1和index2的X值一致，可以直接将index2的lamb2_new等同于lamb1_new")
                    # time.sleep(3)
                    continue
                lamb2_new = lamb2_old + e1_e2*y2/temp
                if lamb2_new<0:

                    continue
                elif y1*y2 == 1:
                    if lamb2_new > -A*y1:

                        continue
                elif y1*y2 == -1:
                    if lamb2_new < A*y1:

                        continue
                lamb1_new = -lamb2_new*y1*y2-A*y1

                time.sleep(3)
                self.W0 = self.W0+(lamb1_new-lamb1_old)*y1*x1+(lamb2_new-lamb2_old)*y2*x2
                self.W0 = np.array(self.W0)
                b1_new = y1-sum(self.W0*x1)
                b2_new = y2-sum(self.W0*x2)
                self.b = np.array((b1_new+b2_new)/2)
                self.lamb[index1]=lamb1_new
                self.lamb[index2]=lamb2_new
                print(f"新的lamb:{self.lamb},\nW0为{self.W0},b为{self.b}")

                select_lamb1 = True
                break
            else:
                print(f"可选的E2中：{self.E1E2_sort}，没有满足条件的lamb2")

            if select_lamb1:
                select_lamb1 = False
                self.count_break_KKT()
                self.break_kkt_list = sorted(self.break_kkt.items(), key=lambda d: d[1], reverse=True)
                if len(self.break_kkt_list)==0:
                    self.Finish = True
                    print("已全部服从KKT条件")
                    sum_lamb_y = sum(self.lamb*self.Y)
                    print(f"汇总后的值是否为零：{sum_lamb_y}")
                    print(self.lamb)
                    break

        lambs = sorted([(index1,value1) for index1,value1 in enumerate(self.lamb)],key=lambda x:x[1],reverse=True)
        index1 = lambs.pop(0)[0]
        for index2,value2 in enumerate(lambs):
            if self.Y[index1]!=self.Y[index2] and value2!=0:
                print("++++++++++++++++++++++++++++++++++++")
                x1 = self.X.iloc[index1]
                x2 = self.X.iloc[index2]
                print(self.W0*x1)
                print((self.W0*x1).sum(axis=0))
                b1_new = np.array(self.Y[index1]-(self.W0*x1).sum(axis=0))
                b2_new = np.array(self.Y[index2]-(self.W0*x2).sum(axis=0))
                b_new = (b1_new+b2_new)/2
                self.b = b_new
                print("++++++++++++++++++++++++++++++++++++")
                break

        print(b1_new,b2_new)

        self.W0 = np.array([self.W0])
        print("_________________________")
        print(self.W0)
        print(self.X)
        print(self.b)

        print("_________________________")
        z = (self.W0*self.X).sum(axis=1)+self.b
        self.Y_pre = []
        """原本计划是要大于支持向量边界时，也就是大于1，才能分类为1，小于-1才能分类为-1，但实际还是有些点位于<-1,1>之间，导致无法完全实现点全在两侧边界分类的效果，因此直接用中间的分类函数进行分"""
        for i in z:
            if i>=0:
                self.Y_pre.append(1)
            elif i<0:
                self.Y_pre.append(-1)
        print(f"分类准确率为：{round(sum(self.Y_pre==self.Y)/self.Y.shape[0]*100,2)}%")



test = SMO(X,Y)
test.run()

二、软间隔-对偶问题及smo算法推导

之前要求的对偶问题： $MAX_λL(λ)=∑λ_i-\frac{∑_{i=1}^n∑_{j=1}^nλ_iλ_jx_ix_jy_iy_j}{2}$

是基于线性可分的情况下【即硬间隔】，一旦数据并不是严格线性可分的情况下，SVM就会失效
我猜测，极有可能无法应用SMO算法，计算出正确的λ

因此，每条数据都引入一个松弛变量的 $ξ_i$

然后每条数据的约束条件就变为 $y_i(Wx_i+b)≥1-ξ_i$ ，且ξ≥0

但引入松弛变量，就要在目标函数上，增加惩罚项

原目标函数 $min:f=\frac{w^2}{2}$

增加惩罚项后为 $min:f=\frac{w^2}{2}+C∑ξ_i$

这里的C是我们自己设置的惩罚项权重常数

其实我也很困惑：这个惩罚项到底对于目标函数的实现，有什么作用呢？

按我的初步想法是，将惩罚项放入原函数中， $\frac{w^2}{2}+C∑ξ_i$ 表示,要让 $\frac{w^2}{2}和C∑ξ_i$ 在相互影响相互制约的情况下，尽可能使f(x)达到极小值

那么 $min:f=\frac{w^2}{2}+C∑ξ_i$ 中，如果C比较大，那么松弛变量对目标函数f的影响就会比较大，因此会在训练过程中，偏向于让ξ达到最小，而w就没那么重要了

反之，如果C比较小，则松弛变量ξ对目标函数f的影响就比较小，因此训练过程中会倾向于让w达到最小，松弛变量反而就相对没那么重要。

通常在sklearn中，这个C默认取值为1，但训练出来的结果未必令人满意的，因此要看情况设置C【这部分回头再说】

现在的求解目标为：

目标函数为 $min:f=\frac{w^2}{2}+C∑ξ_i$
约束条件为：
- $g(w,b,ξ) = 1-ξ_i-y_i(Wx_i+b)≤0$ ，这是约束条件1
- $ξ \geq 0$ ，这是约束条件2，转为 $- ξ \leq 0$

根据拉格朗日乘数法，建立函数L：
第一个约束条件，用λ表示对应的拉格朗日乘子
第二个约束条件，用β表示对应的拉格朗日乘子

$L(w,b,ξ,λ,β)=\frac{w^2}{2}+CΣξ_i+Σλ_i[1-ξ_i-y_i(Wx_i+b)]-Σβ_iξ_i$

KKT条件是：

$λ_i[1-ξ_i-y_i(Wx_i+b)]=0$
- $λ_i>0时， 1-ξ_i-y_i(Wx_i+b)=0$
- $λ_i=0时， 1-ξ_i-y_i(Wx_i+b)≤0$
$β_iξ_i=0$
- $β_i>0时，ξ_i=0$
- $β_i=0时，ξ_i≥0$

将拉格朗日函数，变为对偶问题：
$L(w,b,ξ,λ,β)=\frac{w^2}{2}+CΣξ_i+Σλ_i[1-ξ_i-y_i(Wx_i+b)]-Σβ_iξ_i$

由于求极值过程中，是要先w,b,ξ求其极小值，因此可以同之前硬间隔那样推导出对偶函数为

$Max_{λ,β}Min_{w,b,ξ} L(w,b,ξ,λ,β)=\frac{w^2}{2}+CΣξ_i+Σλ_i[1-ξ_i-y_i(Wx_i+b)]-Σβ_iξ_i$

先对w,b,以及每一个ξ_i分别求偏导，得到以下三个条件

$w = Σλ_ix_iy_i$ ———①
$Σλ_iy_i=0$ ———②
$C-λ_i-β_i = 0$ ———③

将 $C-Σλ_i-Σβ_i = 0$ 转为 $Σβ_i =C-Σλ_i$ ，并结合①，代入对偶函数，整理得到

$=Σλ_i-\frac{1}{2}ΣΣλ_iλ_jy_iy_jx_ix_j$ ，这会发现，与之前硬间隔的对偶函数是一样的

松弛变量ξ及对应的拉格朗日乘子β，对目标求解并无直接影响。

但KKT条件是对SMO迭代时，有条件上的额外限制

KKT条件是：

$λ_i[1-ξ_i-y_i(Wx_i+b)]=0$
- $λ_i>0时， 1-ξ_i-y_i(Wx_i+b)=0$
- $λ_i=0时， 1-ξ_i-y_i(Wx_i+b)≤0$
- 总之： $λ_i≥0$ ————①
$β_iξ_i=0$
- $β_i=C-λ_i>0时，ξ_i=0$
- $β_i=C-λ_i=0时，ξ_i≥0$
- 总之： $β_i=C-λ_i≥0$ ——————②
由①②综合得： $C≥λ_i≥0$

对偶补充条件是:

$w = Σλ_ix_iy_i$
$Σλ_iy_i=0$
$C-λ_i-β_i = 0$

在SMO迭代时的5个步骤里,在第①③④⑤上都有各自对应的调整

①未知参数赋初值：C、λ、w、b

C: 可先设置为1
λ：λ_i全赋值为0，这样即可保证 $Σλ_iyi=0$
ξ： $ξ_i由C-λ_i得到$
W： $W=∑λ_ix_i*y_i，因此W也全为0$
b：b没有条件限制要求，可以直接赋值为0

②选择2个迭代λ（用λ_1,λ_2分别代表选中的2个λ）

λ1的选择方式：选择最偏离KKT条件的λ
- 首先是违反KKT条件，
  - $λ_i[1-ξ_i-y_i(Wx_i+b)]=0$
  - $λ_i>0时， 1-ξ_i-y_i(Wx_i+b)=0$
  - $λ_i=0时， 1-ξ_i-y_i(Wx_i+b)≤0$
- 其次违反程度通过 $ma x : 1 - ξ - y (w x + b)$ 值来衡量，即选择 $ma x : 1 - ξ - y (w x + b)$ 下的 $λ_i$
  但建议还是将违反KKT条件的程度，降序排列得到一个违反KKT条件的 $1 - ξ - y (w x + b)$ 降序列表
- 这样，如果 $1 - ξ - y (w x + b)$ 的最大值对应的λ1不满足迭代条件时，还可以退而求其次，选 $1 - ξ - y (w x + b)$ 第二大对应的λ1
- 【判断1】若选不到λ1，说明所有λ都满足KKT条件，可停止SMO算法
λ2的选择方式：选择能使λ2改变最大的λ
- 公式推导出的 $λ2_{new}=λ2_{old}+\frac{y_i*(E1-E2)}{K11+K22-2K12}$ ，当 $∣ E 1 - E 2∣ 大$ 说明这两条对应的数据差距比较大【后续再公式推导】
- 【判断1】若当前|E1-E2|最大的λ2不满足条件要求，则重选λ，即退而求其次选|E1-E2|第二大对应的λ2
- 【判断2】若选不到λ2，则重新选λ1，再选λ2
  - 重选λ1，是指选下一个偏离KKT条件的λ，而不是最偏离了【降序选择λ1】

最终整理出 $λ_{2old}+\frac{y2*(E1-E2)}{x1.x1+x2.x2-2x1.x2}$

③求解迭代后的λ，并判断是否满足迭代条件

条件1：λ≥0，即求解出的λ1、λ2都要满足 $C \geq λ \geq 0$ 的条件

通过上一步可得到 $λ_{2old}+\frac{y2*(E1-E2)}{x1.x1+x2.x2-2x1.x2}$

因此可先判断 $0 \leq λ 2 \leq C$ ————①

接着判断λ1，由 $C≥λ_1 = -λ_2y_1y_2-Ay_1≥0$ 可得

$当y1y2 = 1时：C≥ -λ_2-Ay_1≥0$
- $C+Ay_1≤λ_2≤-Ay_1$ 结合上式①得λ2最终的取值范围：
- $max(0,C+Ay_1)≤λ_2≤min(C,-Ay_1)$
- 简化为 $L≤λ_2≤H$
$当y1y2 = -1时：C+Ay_1≥λ2≥Ay_1$ ——————②
- 结合上式①得λ2最终的取值范围：
- $max(0,Ay_1)≤λ_2≤min(C,C+Ay_1)$
- 简化为 $L≤λ_2≤H$
如果满足 $L≤λ_2≤H$ ，则继续往下
如果不满足条件，则直接剪枝后，再继续往下
- 当λ2>H时，使λ2=H
- 当λ2

④计算当前的 $W_{new},b_{new}$

计算出满足λ≥0的λ1和λ2后，可代入求解最新的 $W_{new}$

$W_{old} = λ_{1old}y_1x_1+λ_{2old}y_2x_2+∑^n_{i=3}λ_iy_ix_i$

$W_{new} = λ_{1}y_1x_1+λ_{2}y_2x_2+∑^n_{i=3}λ_iy_ix_i$

则 $W_{new} = W_{old}+(λ_{1}-λ_{1old})y_1x_1+(λ_{2}-λ_{2old})y_2x_2$

可见，每次W的更新，都只与选择的两个λ有关

$b_{new}$ ，表示两条边界上的b1和b2的中间值

怎么判断是不是边界呢？

其实也就是当λ>0的时候，因此λ>0，则g(w,b)=0，这在之前的拉格朗日乘数法中已证明为支持向量，即边界

因此，则当λ1、λ2均大于0且小于C时，根据 $g(w,b) = 1-ξ_i-y_i(W_{new}x_i+b) = 0$

要求松弛变量 $ξ_i$ 同时为0，则 $β_i>0$ ,即 $C-λ_i>0$

综合得当 0<λ

求出
$b_{1new}= y_1-W_{new}x_1$
$b_{2new}= y_2-W_{new}x_2$

则 $b_{new} = \frac{b_{1new}+b_{2new}}{2}$

⑤若全部满足KKT条件，或达到迭代次数，则停止SMO算法

增加软间隔后的分类速度其实很快，而且准确率相对高一点点儿

代码改动量不大，主要只需要改动的是计算出新的λ时，要进行判断和剪枝

import numpy as np
import pandas as pd
import random
import matplotlib.pyplot as plt
import time
# 获取所需数据：
datas = pd.read_excel('./datas6.xlsx')
important_features = ['推荐分值','专业度','推荐类型']
# datas = pd.read_excel('./datas5.xlsx')
# important_features = ['推荐分值','推荐类型']

datas_1 = datas[important_features].head(100)
Y = datas_1['推荐类型']
X = datas_1.drop('推荐类型',axis=1)
X_features = X.columns
Y_features = '推荐类型'
rows,columns = datas_1.shape

Y=Y.where(Y!="高推荐",other=1) # 高推荐设置为1
Y=Y.where(Y!="低推荐",other=-1) # 低推荐设置为-1

class SMO():
    def __init__(self,X,Y):
        self.X = X
        self.Y = Y
        self.C = 1
        self.m = X.shape[1]
        self.n = Y.shape[0]
        self.lamb = np.zeros(self.n)
        self.β = self.C-self.lamb
        self.b = 0
        self.W0 = np.zeros(self.m)
        self.times = 5
        self.Finish = False
        self.break_kkt = {}
        self.break_kkt_list = []
        self.E = None


    def count_break_KKT(self):
        del self.break_kkt
        self.break_kkt = {}
        self.g = 1-self.Y*((self.W0*self.X).sum(axis=1)+self.b)
        # time.sleep(3)
        for index,g_value in self.g.items():
            a = self.lamb[index]
            if a < 0:
                raise Exception(f"lamb1_new为{self.lamb1_new},还是小于0")
            elif a == 0 and g_value>0:
                self.break_kkt[index] = abs(g_value)
            elif a > 0 and g_value!=0:
                self.break_kkt[index] = abs(g_value)


    def run(self):
        select_lamb1 = False
        while not self.Finish and self.times>0:
            if len(self.break_kkt_list) == 0:
                self.count_break_KKT()
                self.break_kkt_list = sorted(self.break_kkt.items(), key=lambda d: d[1], reverse=True)
                if len(self.break_kkt_list) == 0:
                    print("已全部满足KKT")
                    break
            # print(f"当前违反KKT条件的：{self.break_kkt_list}")
            # time.sleep(3)
            index1 = self.break_kkt_list.pop(0)[0]
            x1 = self.X.iloc[index1]
            y1 = self.Y[index1]
            lamb1_old = self.lamb[index1]
            self.E = (self.W0 * self.X).sum(axis=1) + self.b - self.Y
            e1 = self.E[index1]
            self.E1E2_all = e1-self.E
            self.E1E2_abs = (e1-self.E).abs()
            self.E1E2_sort = sorted(self.E1E2_abs.items(), key=lambda d: d[1], reverse=True)
            # print(f"当前的E1E2排序：{self.E1E2_sort}")
            # time.sleep(3)
            self.times -= 1
            for j in self.E1E2_sort:
                index2 = j[0]

                x2 = self.X.iloc[index2]
                y2 = self.Y[index2]
                lamb2_old = self.lamb[index2]
                e1_e2 = self.E1E2_all[index2]
                # print(f"选中的第{index1}和第{index2}的E差值为{e1_e2},参数：{self.lamb[index1], self.lamb[index2]}")
                # time.sleep(3)
                if e1_e2 == 0:
                    # print(f"由于两者的E差值为0，因此不进行迭代")
                    select_lamb1 = True
                    break
                temp = sum(x1*x1+x2*x2-2*x1*x2)
                A = -lamb1_old*y1-lamb2_old*y2
                if temp==0:
                    continue
                lamb2_new = lamb2_old + e1_e2*y2/temp

                if y1*y2 == 1:
                    L = max(0,-self.C-A*y1,)

                    H = min(self.C,-A*y1)
                    if lamb2_new<L:
                        lamb2_new = L
                    elif lamb2_new>H:
                        lamb2_new = H
                    elif lamb2_new<H and lamb2_new>L:
                        pass
                    else:
                        print("怎么H还比L小呢")
                        self.Finish = True
                        break
                elif y1*y2 == -1:
                    L = max(0,A*y1)
                    H = min(self.C,self.C+A*y1)
                    if lamb2_new<L:
                        lamb2_new = L
                    elif lamb2_new>H:
                        lamb2_new = H
                    elif lamb2_new<H and lamb2_new>L:
                        pass
                    else:
                        print("怎么H还比L小呢")
                        self.Finish = True
                        break

                lamb1_new = -lamb2_new*y1*y2-A*y1

                time.sleep(3)
                self.W0 = self.W0+(lamb1_new-lamb1_old)*y1*x1+(lamb2_new-lamb2_old)*y2*x2
                self.W0 = np.array(self.W0)
                if 0<lamb1_new and lamb1_new<self.C:
                    b1_new = y1-sum(self.W0*x1)
                if 0 < lamb2_new and lamb2_new < self.C:
                    b2_new = y2-sum(self.W0*x2)
                self.b = np.array((b1_new+b2_new)/2)
                self.lamb[index1]=lamb1_new
                self.lamb[index2]=lamb2_new
                self.β[index1]=self.C-lamb1_new
                self.β[index2]=self.C-lamb2_new
                print(f"新的lamb:{self.lamb},\nW0为{self.W0},b为{self.b}")
                select_lamb1 = True
                break
            else:
                print(f"可选的E2中：{self.E1E2_sort}，没有满足条件的lamb2")

            if select_lamb1:
                select_lamb1 = False
                self.count_break_KKT()
                self.break_kkt_list = sorted(self.break_kkt.items(), key=lambda d: d[1], reverse=True)
                if len(self.break_kkt_list)==0:
                    self.Finish = True
                    print("已全部服从KKT条件")
                    sum_lamb_y = sum(self.lamb*self.Y)
                    print(f"汇总后的值是否为零：{sum_lamb_y}")
                    print(self.lamb)
                    break

        lambs = sorted([(index1,value1) for index1,value1 in enumerate(self.lamb)],key=lambda x:x[1],reverse=True)
        index1 = lambs.pop(0)[0]
        for index2,value2 in enumerate(lambs):
            if self.Y[index1]!=self.Y[index2] and value2!=0:
                print("++++++++++++++++++++++++++++++++++++")
                x1 = self.X.iloc[index1]
                x2 = self.X.iloc[index2]
                print(self.W0*x1)
                print((self.W0*x1).sum(axis=0))
                b1_new = np.array(self.Y[index1]-(self.W0*x1).sum(axis=0))
                b2_new = np.array(self.Y[index2]-(self.W0*x2).sum(axis=0))
                b_new = (b1_new+b2_new)/2
                self.b = b_new
                print("++++++++++++++++++++++++++++++++++++")
                break

        print(b1_new,b2_new)

        self.W0 = np.array([self.W0])
        print("_________________________")
        print(self.W0)
        print(self.X)
        print(self.b)

        print("_________________________")
        z = (self.W0*self.X).sum(axis=1)+self.b
        self.Y_pre = []
        for i in z:
            if i>=0:
                self.Y_pre.append(1)
            elif i<0:
                self.Y_pre.append(-1)
            else:
                print("居然还有点位于支持向量中间的点，big problem")
        print(f"分类准确率为：{round(sum(self.Y_pre==self.Y)/self.Y.shape[0]*100,2)}%")
        print("_________________________")
        z = (self.W0*self.X).sum(axis=1)+self.b
        # z1 = (self.W0 * self.X).sum(axis=1) + b1_new
        # z2 = (self.W0 * self.X).sum(axis=1) + b2_new
        map_color = {-1: 'r', 1: 'g'}
        color = list(map(lambda x: map_color[x], self.Y))
        plt.scatter(np.array(z), np.array(self.Y),c=color)

        plt.show()


test = SMO(X,Y)
test.run()

你可能感兴趣的:(机器学习,算法,人工智能)

全局路径规划器：full_coverage_path_planner完全指南段钰忻
全局路径规划器：full_coverage_path_planner完全指南项目地址:https://gitcode.com/gh_mirrors/fu/full_coverage_path_planner项目介绍full_coverage_path_planner是一个在ROS（RobotOperatingSystem）环境下开发的开源全局路径规划算法实现，旨在提供全面覆盖的路径规划解决方案。该
【大一新生必收藏系列】❤机器学习7大方面，30个数据集。纯干货分享❤ .Boss. 机器学习人工智能 python 算法开发语言笔记 #大一新生
.记住了就可以跟同学装起来了嗷....目录.纯干货回归问题分类问题图像分类文本情感分析自然语言处理自动驾驶金融类...........纯干货..................在刚刚开始学习算法的时候，大家有没有过这种感觉，最最重要的那必须是算法本身！其实在一定程度上忽略了数据的重要性。而事实上一定是，质量高的数据集可能是最重要的！数据集在机器学习算法项目中具有非常关键的重要性，数据集的大小、质量
使用DeepSeek自动生成PPT：高效办公的终极指南点我头像干啥 Ai 人工智能信息可视化深度学习
引言在现代职场中，PPT（PowerPoint演示文稿）已经成为沟通、展示和分享想法的重要工具。然而，制作一份高质量的PPT往往需要耗费大量时间和精力，尤其是在内容整理、排版设计和样式调整方面。幸运的是，随着人工智能技术的发展，像DeepSeek这样的工具可以帮助我们自动化生成PPT，极大地提升工作效率。本文将详细介绍如何使用DeepSeek自动生成PPT，并分享一些实用技巧，帮助你快速上手。一、
ARTS Week 45 javascript
Algorithm本周的算法题为1475.商品折扣后的最终价格给你一个数组prices，其中prices[i]是商店里第i件商品的价格。商店里正在进行促销活动，如果你要买第i件商品，那么你可以得到与prices[j]相等的折扣，其中j是满足j>i且prices[j]{letlowerPriceIndexes=[]letpriceDifference=0prices.forEach((compare
非对称加密算法——SIDH加密算法 java
JavaSIDH算法解析理论背景1.1后量子密码学随着量子计算机的发展，传统公钥密码体系（如RSA、ECC）面临被Shor算法破解的风险。后量子密码学（Post-QuantumCryptography）研究能够抵御量子攻击的新型加密算法，主要包含以下类型：基于格的密码学基于编码的密码学多元多项式密码学基于超奇异椭圆曲线同源的密码学（SIDH）1.2椭圆曲线基础SIDH基于超奇异椭圆曲线及其同源映射
小狐狸AI数字人源码独立SAAS部署全开源+搭建环境教程 kaui52066 kaui52066精品源码人工智能 uni-app 前端小程序 php 小狐狸AI数字人数字人源码
一.系统介绍小狐狸AI数字人分身系统源码独立部署支持PC端、小程序端、H5端，一键克隆真人形象+声音核心功能亮点：1:1真人级克隆技术声音克隆：上传3分钟音频，AI深度学习声纹特征，复刻语气、情感、方言形象克隆：通过照片/视频建模，生成动态3D数字人，表情自然，动作流畅智能口型同步引擎AI算法精准匹配唇形与语音，实现口型同步0门槛SAAS化操作无需专业设备，网页端一键生成数字人视频海量模板库：电商
OTSU算法（大津算法）理解&代码当代女大学生机器学习 python 计算机视觉算法
OTSU算法：对图像进行二值化的算法介绍OTSU算法是一种自适应的阈值确定的方法，又称大津阈值分割法，是最小二乘法意义下的最优分割。它是按图像的灰度特性，将图像分成背景和前景两部分。因方差是灰度分布均匀性的一种度量,背景和前景之间的类间方差越大,说明构成图像的两部分的差别越大,当部分前景错分为背景或部分背景错分为前景都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。从大津法的原
ESP-IDF中FreeRTOS的三种任务调度算法蓝天居士 ESP-IDF ESP32-S3 ESP32-C3 ESP-IDF
本文内容参考：STM32F103移植FreeRTOS必须搞明白的系列知识---2（FreeRTOS任务优先级）_freertos最多支持多少个任务-CSDN博客浅析FreeRTOS任务调度器的三种调度算法和应用-电子发烧友网特此致谢！FreeRTOS中的任务调度算法FreeRTOS支持多种任务调度算法，可通过配置来满足不同应用的需求。可以通过配置configUSE_PREEMPTION和confi
用Python打造AI玩家：挑战2048，谁与争锋穿梭的编织者人工智能 python
文章目录一、创作背景二、效果图三、准备工作1.安装Chrome和ChromeDriver2.安装Python库四、代码说明‌1.init_driver函数‌2.play_2048函数‌五、完整代码六、改进版本七、主要模块八、核心算法分析1.棋盘状态获取2.位置权重系统3.连续性评估4.单调性评估5.移动模拟系统九、评估系统1.评估标准2.决策机制十、性能优化1.延迟控制2.错误处理十一、完整代码编
OpenCV学习(二十一) ：计算图像连通分量:connectedComponents(),connectedComponentsWithStats() Leon_Chen0 OpenCV
OpenCV学习(二十一)：计算图像连通分量:connectedComponents(),connectedComponentsWithStats()1、connectedComponents()函数ConnectedComponents即连通体算法用id标注图中每个连通体，将连通体中序号最小的顶点的id作为连通体的id。如果在图G中，任意2个顶点之间都存在路径，那么称G为连通图，否则称该图为非连
数据结构与算法——数据结构4 写代码写到手抽筋数据结构与算法数据结构
程序员没有稳定一说，目前学习数据结构，其实不难，最近在学习，系统性的总结下，便于后续复习和使用。主要是把线性表，全名为线性存储结构。使用线性表存储数据的方式可以这样理解，即“把所有数据用一根线儿串起来，再存储到物理空间中”。分为顺序表和单链表。顺序表单链表同时还要知道顺序表和链表的优缺点【待补充】还要知道链表反转，知道迭代法和递归法就可以【】还需要知道单链表相交的思路【】后边了解静态链表的原理静态
LVS、Haproxy、Nginx区别 SHISHIZHIZHI nginx 负载均衡服务器
LVS、Haproxy、Nginx区别一、Haproxy调度算法1.常见的web集群调度器2.Haproxy应用分析3.Haproxy调度算法原理4.Haproxy的主要特性5.Haproxy的优点6、LVS.Haproxy、Nginx区别二、Haproxy优化三、Haproxy日志1.修改主配置文件2.修改rsyslog配置一、Haproxy调度算法1.常见的web集群调度器目前常见的web集群
（大模型微调大模型学习路线大模型入门）_大模型学习，吹爆！2025最详细的大模型学习路线已整理！手把手带你高效入门，大模型论文全打通！大模型老炮学习人工智能大模型学习 AI 大模型大模型微调大模型教程
一、初聊大模型1、什么是大模型？大模型，通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑，这些大脑通过阅读大量的文本、图片、声音等信息，学习到了世界的知识。这些大脑（模型）非常大，有的甚至有几千亿个参数，这些参数就像是大脑中的神经元，它们通过复杂的计算来理解和生成语言、图片等。举个例子，你可能听说过GPT-3，它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问
OTSU算法（大津算法）天行者@ 算法 opencv 人工智能二值化
Otsu算法（大津算法）是一种经典的图像二值化方法，其核心是通过最大化类间方差自动确定全局阈值。以下是其具体工作原理和步骤：1.基本思想假设图像由前景（目标）和背景两部分组成，且两者的灰度分布存在明显差异（直方图呈现双峰）。Otsu算法通过寻找一个阈值，使得前景与背景之间的类间方差最大，从而将图像分割为二值图。2.数学推导（1）计算灰度直方图统计图像中每个灰度值的像素个数，得到直方图h[i]（i为
国产 DeepSeek V3 被秒成“前浪“？谷歌开放最强 Gemini 2.0 全家桶：速度快60倍，上下文还长16倍！ Bryan Ding 人工智能深度学习
谷歌向所有人发布了Gemini2.0——迄今为止谷歌“功能最强大”的人工智能模型套件。1谷歌Gemini2.0向所有人开放去年12月，谷歌发布Gemini2.0Flash的实验版本，正式开启了代理型AI的新时代。Gemini2.0Flash是谷歌为开发者群体打造的高效主力模型，具有低延迟、高性能等优势。今年早些时候，谷歌在GoogleAIStudio中更新了2.0FlashThinkingExpe
python 基于混合式推荐算法的学术论文投稿系统 mosquito_lover1 python 知识图谱
基于混合式推荐算法的学术论文投稿系统是一个结合多种推荐技术（如基于内容的推荐、协同过滤、知识图谱等）来为研究者推荐合适期刊或会议投稿的系统。以下是实现该系统的关键步骤和Python代码示例。系统设计思路1.数据收集与预处理：-收集论文数据（标题、摘要、关键词、作者信息等）。-收集期刊/会议数据（领域、主题、影响因子、投稿要求等）。-对文本数据进行预处理（分词、去停用词、向量化等）。2.推荐算法设计
L1-5 别再来这么多猫娘了！云格～团队天梯赛算法 c++
以GPT技术为核心的人工智能系统出现后迅速引领了行业的变革，不仅用于大量的语言工作（如邮件编写或文章生成等工作），还被应用在一些较特殊的领域——例如去年就有同学尝试使用ChatGPT作弊并被当场逮捕（全校被取消成绩）。相信聪明的你一定不会犯一样的错误！言归正传，对于GPT类的AI，一个使用方式受到不少年轻用户的欢迎——将AI变成猫娘：当然，由于训练数据里并不区分道德或伦理倾向，因此如果不加审查，A
Gemini 2.0 Flash 新加坡内哥谈技术人工智能大数据语言模型
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/过去一年，人工智能领域取得了令人瞩目的进展。如今，备受期待的Gemini2.0系列首款模
OpenAI 团队组织架构和研发技术栈 AI天才研究院 ChatGPT 人工智能
OpenAI是一家致力于推动人工智能技术发展的公司，成立于2015年。其目标是确保人工智能技术造福全人类。为了实现这一目标，OpenAI采用了多种先进的技术和组织架构来推动其研发工作。目录OpenAI组织架构和研发技术栈概述1OpenAI团队的世界顶尖科学家IlyaSutskever：Ilya是OpenAI的联合创始人之一，也是深度学习领域的先驱。他在神经网络和深度学习方面的研究具有重要影响，曾与
机器学习中的梯度到底是什么？（chat-gpt问答）湫怿机器学习 gpt 人工智能梯度
1、梯度是对损失函数求导吗？是的，梯度是对损失函数（或目标函数）求导数值化后的结果。梯度告诉我们目标函数在某个点上的方向性和变化率，这些信息是优化算法推进参数评估和更新的重要指标。在机器学习中，我们通过不断调整参数，使目标函数达到最小值，从而实现模型的训练和学习。2、为什么梯度要求偏导来求解？梯度是一个向量，它的方向指向函数值增加最快的方向，其大小表示函数值的变化率。为了确定梯度的方向和大小，需要
计算机视觉算法实战——驾驶员玩手机检测（主页有源码）喵了个AI 计算机视觉实战项目计算机视觉算法智能手机
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.领域简介：玩手机检测的重要性与技术挑战驾驶员玩手机检测是智能交通安全领域的核心课题。根据NHTSA数据，美国每年因手机使用导致的交通事故超过3000起，中国公安部的统计显示开车使用手机的事故率是正常驾驶的23倍。该技术通过实时监测驾驶员手部动作和视线方向，识别非法使用手机行为，在以
大型语言模型与强化学习的融合：迈向通用人工智能的新范式——基于基础复现的实验平台构建（initial）大模型科普人工智能强化学习
1.引言大型语言模型（LLM）在自然语言处理领域的突破，展现了强大的知识存储、推理和生成能力，为人工智能带来了新的可能性。强化学习（RL）作为一种通过与环境交互学习最优策略的方法，在智能体训练中发挥着重要作用。本文旨在探索LLM与RL的深度融合，分析LLM如何赋能RL，并阐述这种融合对于迈向通用人工智能（AGI）的意义。为了更好地理解这一融合的潜力，我们基于“LargeLanguageModela
深入解析 React Diff 算法：原理、优化与实践赵大仁前端技术 js react.js 前端前端框架
深入解析ReactDiff算法：原理、优化与实践1.引言React作为前端领域的标杆框架，采用虚拟DOM（VirtualDOM）来提升UI更新性能。React的Diff算法（Reconciliation）是虚拟DOM运行机制的核心，它决定了如何高效地对比新旧DOM并执行最少的操作来更新UI。本篇文章将深入探讨ReactDiff算法的原理、优化策略，并通过生动的示例解析其工作方式，让你能够更直观地理
太速科技-基于3U VPX的 Jetson Xavier NX GPU计算主板北京太速科技股份有限公司人工智能
基于3UVPX的JetsonXavierNXGPU计算主板一、产品概述基于3UVPX的JetsonXavierNXGPU计算主板，是AI人工智能的低功耗计算平台，是LINUX环境下软件开发等的理想工具，拥有VPX标准连接器和特性的接口。二、板卡原理框图三、板卡外扩功能P0接口电源输入+12V，板卡总功耗60W以内P1接口1路RS422接口，一路GigabitEthernet前面板接口MICROUS
深入浅出C++ STL：统领STL全局有梦想的电信狗《C++语法精粹》——c++stl 数据结构算法开发语言 ide visualstudio
深入浅出C++STL：统领STL全局深入浅出C++STL：统领STL全局github主页地址前言一、STL的前世今生1.1什么是STL？1.2STL版本演进二、STL六大核心组件详解2.1容器（Containers）容器性能对照表2.2算法（Algorithms）2.3迭代器（Iterators）2.4仿函数（Functors）2.5适配器（Adapters）2.6空间配置器（Allocators
机器学习中的梯度下降是什么意思？ yuanpan 机器学习人工智能
梯度下降（GradientDescent）是机器学习中一种常用的优化算法，用于最小化损失函数（LossFunction）。通过迭代调整模型参数，梯度下降帮助模型逐步逼近最优解，从而提升模型的性能。1.核心思想梯度下降的核心思想是利用损失函数的梯度（即导数）来指导参数的更新方向。具体来说：梯度：梯度是损失函数对模型参数的偏导数，表示损失函数在当前参数点上的变化率。下降：通过沿着梯度的反方向（即损失函
c++模板初阶晚安，cheems c++开发语言
1.泛型编程泛型编程是一种编程范式，它允许程序员在编写代码时定义算法和数据结构时可以处理不同类型的数据，而不必为每种数据类型编写特定的代码。泛型编程的主要目的是提高代码的复用性、灵活性和可维护性。以下是一些关于泛型编程的基本概念：泛型的优点代码复用：同一套代码可以用于不同的数据类型。类型安全：在编译时就能检查出错误，而不是在运行时。性能：由于不需要进行类型转换，可以生成更高效的代码。泛型编程的例子
CIR-DFENet：结合跨模态图像表示和双流特征增强网络进行活动识别是Dream呀神经网络计算机视觉人工智能神经网络深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和求职工作的先行者！【优惠信息】•新专栏订阅前200名享9.9元优惠•订阅量破200
AI Agent席卷B端：解锁部门效率新玩法，挑战企业软件的智能革命 Hello kele 人工智能经验分享 AI编程程序员
随着人工智能技术的迅猛发展，AIAgent（人工智能代理）作为一种新兴的生产力工具，正在深刻改变企业软件生态。特别是在B端（面向企业端）的应用场景中，AIAgent的潜力逐渐显现。从最近Dify在GitHub上突破8万Star、进入开源领域Top100，到OpenManus几天内收获2万Star的惊人表现，开源AI项目的爆发式增长表明，在AI时代，优质的开源项目正以空前的速度吸引关注。与此同时，传
动态路由RIP的总结 nihuhui666 网络智能路由器 RIP
动态路由所有路由器运行相同的路由协议,之后通过路由器之间的沟通,协商计算到达未知网段的路由信息静态路由优点:1.选路由管理员选择,更好掌控2.路由器资源占用更少3.静态路由相对动态路由更加安全缺点:1.配置量大2.静态路由无法根据网络拓扑结构的变化而变化—收敛动态路由:缺点:1.通过单一算法计算出来的路径,可能出现选路不佳2.资源占用多3.没有静态路由安全优点:1.配置量少2.动态路由可以根据网络
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

机器学习——SMO算法推导与实践

一、 硬间隔-SMO算法推导

1. 算法步骤总览

①未知参数赋初值

②选择2个迭代λ（用λ_1,λ_2分别代表选中的2个λ）

③求解迭代后的λ，并判断是否满足迭代条件

④计算当前的 W n e w , b n e w W_{new},b_{new} Wnew​,bnew​

⑤若全部满足KKT条件，或达到迭代次数，则停止SMO算法

二、 软间隔-对偶问题及smo算法推导

①未知参数赋初值：C、λ、w、b

②选择2个迭代λ（用λ_1,λ_2分别代表选中的2个λ）

③求解迭代后的λ，并判断是否满足迭代条件

④计算当前的 W n e w , b n e w W_{new},b_{new} Wnew​,bnew​

⑤若全部满足KKT条件，或达到迭代次数，则停止SMO算法

你可能感兴趣的:(机器学习,算法,人工智能)

一、硬间隔-SMO算法推导

④计算当前的 $W_{new},b_{new}$

二、软间隔-对偶问题及smo算法推导

④计算当前的 $W_{new},b_{new}$